Превращение слова или предложения в понятный для нейросети вид

#1
Доброго времени суток! Заинтересовался темой нейронных сетей, прочитал кучу теории, простой и не очень, решил перейти к практике. Думаю написать некий классификатор введенных предложений или словосочетаний, хотя бы по эмоциональному оттенку. Структура сети в принципе понятна и вроде бы несложно реализуема, а вот при вопросе о передаче текста ей на вход возникает очень интересный вопрос - как? :) Начитался уже о векторизации - лемматизации слов, но все равно остается непонятным, как даже после получения файла с векторами слов подать их на вход нейросети? Ведь если искать похожие слова в таком векторизованном корпусе - да, они как раз индексируются значениями 0..1, а исходные слова-то нет... В-общем, совсем нет идей, но ведь реализуют же как-то люди :)
 

Andrey

Новичок
#2
Присоединяюсь к вопросу.
Также еще интересуют как преобразовать время, даты, дни недели и месяцы и подавать их на вход?
 

Денис

Пользователь
#3
В этой теме:
Как-нейросети-пишут-стихи
Описал свою идею как нейросеть может предсказывать следующее слово по предыдущим.
Возможно таким же образом она сможет классифицировать целые фразы.
 
Последнее редактирование:

Денис

Пользователь
#4
Присоединяюсь к вопросу.
Также еще интересуют как преобразовать время, даты, дни недели и месяцы и подавать их на вход?
Тут тоже нужно смотреть на цель, самый простой способ - нормализация отдельно годов, месяцев и дней, например на нейрон отвечающий за месяцы нужно подавать соответственно:
0,08; 0,17; 0,25; 0,33; 0,42; 0,5; 0,58; 0,67; 0,75; 0,83; 0,92; 1,0
UPD:
Хотел добавить что по моим скромным наблюдениям нейросеть лучше понимает если минимальный сигнал для реакции составляет 0,5 например.
Другими словами отсчет месяцев должен происходить от 0,5 до 1,0:
0,54; 0,58; 0,63; 0,67; 0,71; 0,75; 0,79; 0,83; 0,88; 0,92; 0,96; 1,0
Так нейросеть лучше отличает сигнал от случайного шума.
 
Последнее редактирование: