Мастера DELPHI, Delphi programming community Рейтинг@Mail.ru Титульная страница Поиск, карта сайта Написать письмо 
| Новости |
Новости сайта
Поиск |
Поиск по лучшим сайтам о Delphi
FAQ |
Огромная база часто задаваемых вопросов и, конечно же, ответы к ним ;)
Статьи |
Подборка статей на самые разные темы. Все о DELPHI
Книги |
Новинки книжного рынка
Новости VCL
Обзор свежих компонент со всего мира, по-русски!
|
| Форумы
Здесь вы можете задать свой вопрос и наверняка получите ответ
| ЧАТ |
Место для общения :)
Орешник |
Коллекция курьезных вопросов из форумов
KOL и MCK |
KOL и MCK - Компактные программы на Delphi
Основная («Начинающим»)/ Базы / WinAPI / Компоненты / Сети / Media / Игры / Corba и COM / KOL / FreePascal / .Net / Прочее / rsdn.org

 
Чтобы не потерять эту дискуссию, сделайте закладку « предыдущая ветвь | форум | следующая ветвь »

Понимание текста компьютером


Larin ©   (05.07.18 08:09

А как на данном этапе развития технологий обстоят дела с пониманием текста, написанного человеком, компьютером (программами)? Может ли она успешно переписываться с человеком (как в мессенджере) или из текста (новостного, научного) извлекать суть?


KSergey ©   (05.07.18 08:18[1]

Что такое "извлекать суть"?

По поводу ботов - вроде новости у всех на слуху про Сири, Алису, майкрософтовскую девочку как-то еще звали (но она оказалось плохой девочкой, её придушили)


RWolf ©   (05.07.18 10:15[2]

https://www.youtube.com/watch?v=f2bQJCGxmNc


KSergey ©   (05.07.18 11:56[3]

> RWolf ©   (05.07.18 10:15) [2]

Прикольно
чуешь себя и свою деятельность динозавром )


KilkennyCat ©   (05.07.18 17:17[4]

http://delphimaster.ru/chat/


kilkennycat ©   (05.07.18 17:19[5]


> KSergey ©   (05.07.18 11:56) [3]

неприкольно - безграмотно.


Mystic ©   (05.07.18 20:30[6]

Успешно переписываться может, а вот с пониманием проблемы. Если мы задаём вопрос, и нам надо определить, в какую из наперёд заданных категорий попалает ответ, то мы можем это сделать. Если же нам надо получить произвольную информацию, то тут сложнее потому как нейросеть выдаёт вероятности, а информация кодируется обычно дискретной структурой.

Насколько я знаю, те системы, которые парсят текст, то они сохраняют его сейчас в виде графовой базы данных, и потом просто стараются максимизировать вероятность попадания.


KilkennyCat ©   (05.07.18 21:31[7]

и интонации понимает?


Mystic ©   (05.07.18 23:08[8]


> и интонации понимает?


Да, принципиальных проблем там нет.


ухты ©   (06.07.18 01:05[9]

А если сказать, например, " да нет", поймут ? )


KilkennyCat ©   (06.07.18 01:34[10]


> хты ©   (06.07.18 01:05) [9]

ага, или "да ладно?!"

а еще интересует юридический вопрос. несет ли робот ответственность.


Германн ©   (06.07.18 02:49[11]


> RWolf ©   (05.07.18 10:15) [2]

Не верю что это был робот. Точнее что это был ИИ. ИИ не будет "а"кать. Т.е. вставлять бессмысленный звук А перед началом фразы. Что можно заметить на 44-й секунде перед фразой "Хорошо, тогда в таком случае я перезвоню...".


KSergey ©   (06.07.18 07:45[12]

> kilkennycat ©   (05.07.18 17:19) [5]
> неприкольно - безграмотно.

Вот бы как-то развернуть ответ.


KSergey ©   (06.07.18 07:50[13]

> Германн ©   (06.07.18 02:49) [11]
> Не верю что это был робот. Точнее что это был ИИ. ИИ не будет "а"кать.

Там есть еще несколько примеров. По ним становится понятнее.
У меня сложилось впечатление, что там записанные фразы реального человека, которые монтируются, а не синтез речи. Может не везде, но явно часто вставлены целые большие куски фраз и фразы. Плюс при вставках чисел - явные нестыковки интонации (как всегда бывает с безграмотно записанными отдельными фразами для автоинформатора).
В том числе вот этот самый фрагмент про "я перезвоню", который, кстати, выглядит совершенно "не в тему" в данном случае ("я перезвоню и расскажу вам о нашем товаре", хотя речь про получение на почте)


Larin ©   (06.07.18 10:16[14]


> Mystic ©   (05.07.18 20:30) [6]
> Успешно переписываться может, а вот с пониманием проблемы.
>  Если мы задаём вопрос, и нам надо определить, в какую из
> наперёд заданных категорий попалает ответ, то мы можем это
> сделать. Если же нам надо получить произвольную информацию,
>  то тут сложнее потому как нейросеть выдаёт вероятности,
>  а информация кодируется обычно дискретной структурой.
>
> Насколько я знаю, те системы, которые парсят текст, то они
> сохраняют его сейчас в виде графовой базы данных, и потом
> просто стараются максимизировать вероятность попадания.


То есть получается, что все эти распиаренные хваленные нейросети - всего лишь сравнение вероятностей?
Я правильно понимаю?


Игорь Шевченко ©   (06.07.18 10:33[15]

https://habr.com/post/416211/


картман ©   (06.07.18 10:54[16]


> То есть получается, что все эти распиаренные хваленные нейросети
> - всего лишь сравнение вероятностей?

твои мозги, меж прочим, работают так же. А по поводу понимания текстов компьютером - все брехня. Ну, может не совсем, а примерно как тушь, увеличивающая ресницы на 300%


Pavia ©   (06.07.18 12:53[17]


> То есть получается, что все эти распиаренные хваленные нейросети
> - всего лишь сравнение вероятностей?Я правильно понимаю?

Распиаренные - да. Хваленные - да.
Всего лишь сравнение вероятностей - нет.
Сравнение вероятности это конечная стадия НС и не основная. И насколько понимаю в задачи о чтении она не участвует.
НС это в первую очередь оптимизация целевой функции.


картман ©   (06.07.18 15:02[18]


> НС это в первую очередь оптимизация целевой функции.

обобщить до потери смысла - прерогатива Копира на данном сайте - кончай с плагиатом))


KilkennyCat ©   (06.07.18 15:13[19]


> KSergey ©   (06.07.18 07:45) [12]

там было "скину" вместо "сообщу", "отправлю" и т.д. Фирма, ведущая официальный диалог с клиентом должна разговаривать нормально.


kilkennycat ©   (06.07.18 15:21[20]


> Larin ©   (06.07.18 10:16) [14]

Насколько мне известно, даже ассоциативный механизм мозга до сих пор неясен. Не говоря уж об озарениях.
Так что, когда говорят, что нейросеть - это ИИ - то да, хваленый пиар.
Вот когда нейросеть на любую фразу типа: "Отправите барахло - ноги повыдираю" ответит как человек,то есть с учетом громадного кол-ва факторов (погода на улице, пролитый борщ на штаны, задержки зарплаты и у любовницы, кавказский акцент собеседника и хилая собственная мышечная масса и т.д.) - вот тогда будет ИИ.


ухты ©   (06.07.18 16:13[21]


> твои мозги, меж прочим, работают так же
как все просто ))


KSergey ©   (06.07.18 16:20[22]

> KilkennyCat ©   (06.07.18 15:13) [19]
> там было "скину" вместо "сообщу", "отправлю" и т.д. Фирма,
>  ведущая официальный диалог с клиентом должна разговаривать нормально.

А, про это.
Не, ну мы же про ИИ / не ИИ говорим; а это так, детали конкретной имплементации, быть может даже умышленные )


ухты ©   (06.07.18 16:40[23]

Тут вот чм2018 в ИИ загрузили, получили вот это (финал германия - бразилия)
https://naviny.by/sites/default/files/2018_wch.jpg тиаких картинок много,
как видно мельдоний пока круче ИИ ;)


ухты ©   (06.07.18 16:42[24]

пысы: а чего превью на картинки не сделали, на код понаделали кучу, и никому не надо, а картинки постят куда как чаще ))


KilkennyCat ©   (06.07.18 21:38[25]


> ухты ©   (06.07.18 16:40) [23]

они просто на -1 забыли умножить, тогда всё верно, германия на последнем месте


картман ©   (07.07.18 01:50[26]


> как все просто ))

Эмерджентность нужно учитывать, а не только мельдоний


Германн ©   (07.07.18 02:16[27]

2 KSergey ©   (06.07.18 07:50) [13]
Так это же какой запас фраз нужно хранить! А ещё и интонацию надо учитывать.


aka ©   (07.07.18 20:48[28]

Подход к решения проблемы не тот. Вы неверное иногда замечали, как человек местами путает слова в контексте? Например: Машина каша -> Кашина маша итд. Или когда работал в одной телефонной компании, замел как люди повально часто путают местами цифры в номерах телефонов. Например: 94558 -> 95845, 58756 -> 55687. Почему-то путают в 90% именно так. В этом зарыт секрет ИИ, нутром чую. Только пока никому про это особо не распространяйтесь, может чего сами напишем))


Pavia ©   (07.07.18 22:34[29]


> Так это же какой запас фраз нужно хранить!

https://habr.com/company/microsoft/blog/352598/
Меньше 1000


Pavia ©   (07.07.18 23:06[30]


> 94558 -> 95845, 58756 -> 55687. Почему-то путают в 90% именно
> так. В этом зарыт секрет ИИ, нутром чую

К примеру вот тут я человеку помог с оптимизацией за счёт перестановок.
Метод отжига. Если задать больше точек любопытные лабиринты получаются.
http://forum.sources.ru/index.php?showtopic=412988&st=0&#entry3773002
Я там особо не сильно старался. Так как это лишь примитив. На самом деле более обобщённая теория это ГА с применением регулировок*.


KilkennyCat ©   (08.07.18 00:00[31]


> Pavia ©   (07.07.18 22:34) [29]

считается, что 300 хватает для общения


картман ©   (08.07.18 00:19[32]

Удалено модератором


asail ©   (08.07.18 14:51[33]

Удалено модератором


картман ©   (08.07.18 17:54[34]

Удалено модератором


KSergey ©   (09.07.18 07:53[35]

Удалено модератором


KilkennyCat ©   (09.07.18 22:28[36]

Удалено модератором


Германн ©   (10.07.18 01:14[37]

Удалено модератором


Inovet ©   (10.07.18 07:00[38]

Удалено модератором


KSergey ©   (10.07.18 07:02[39]

Удалено модератором


Игорь Шевченко ©   (10.07.18 10:48[40]

Удалено модератором


Mystic ©   (13.07.18 18:20[41]


> То есть получается, что все эти распиаренные хваленные нейросети
> - всего лишь сравнение вероятностей?
> Я правильно понимаю?


Распознавание образов чаще всего да. Но вообще нейросеть это просто функция, которая принимает на входе вектор действительных значений и возвращает тоже вектор, возможно другой размерности. Для распознавание образом они используются почти один в один, для игры в шахматах нейросеть используются в некоторых местах более общего алгоритма MCTS, ...


Кто б сомневался ©   (15.07.18 15:04[42]


> RWolf ©   (05.07.18 10:15) [2]
> https://www.youtube.com/watch?v=f2bQJCGxmNc


Какой же это робот, это же человек. Слышно же как дышит в микрофон. Да и роботы так не разговаривают.


Кто б сомневался ©   (15.07.18 15:14[43]

Робот - это когда бот переводит речь в текст, анализируют ее и отвечает синтезируя речь. Как например Сири, Google Assistent, Alexa.
Ксати яблочная Сири самая глупая среди остальных ботов, Вилса про это часто говорит.

А так сейчас очень хорошо развито распознавание голоса в текст. Я частенько начитываю в Android голосом какие то заметки в блокнот (Google Keeper), вполне неплохо справляется, только лучше интернет для этого включить.
И наоборот - текст в голос - к примеру Google Translate позволяет сфоткать текст, распознать его,  перевести и озвучить.
Либо иногда я общаюсь через Google Translate переводчик с кем то - говорю, GT распознает голос, переводит на нужный язык и воспроизводит на этом языке.
И наоборот. Т.е. если общаюсь с иностранцем смарт с GT обычно лежит на столе для случая если что-то не понятно..

В этом плане Apple сильно отстает от Google.


KSergey ©   (15.07.18 16:06[44]

> Кто б сомневался ©   (15.07.18 15:04) [42]
> Какой же это робот, это же человек. Слышно же как дышит
> в микрофон. Да и роботы так не разговаривают.

Вы слишком буквально и узко спорите на автоматизированную речь, так это назовём.
Видно, что в данном примере парни ловко используют записанные довольно крупные фразы, которые подставляются в диалог по заданному сценарию для тупого выяснения ответов на конкретные вопросы.
Хотя, конечно, к теме этого топика вряд ли относится. В этом примере  явно ожидается в ответ конкретное ключевое слово, и при его отсутствии абонента долбят по кругу одним и тем же вопросом.


KilkennyCat ©   (16.07.18 00:49[45]


> Кто б сомневался ©   (15.07.18 15:14) [43]
>  отвечает синтезируя речь.

синтез не обязан быть побуквенным или имитировать голосовые связки со всем остальным ротом


версия для печати

Написать ответ

Ваше имя (регистрация  E-mail 







Разрешается использование тегов форматирования текста:
<b>жирный</b> <i>наклонный</i> <u>подчеркнутый</u>,
а для выделения текста программ, используйте <code> ... </code>
и не забывайте закрывать теги! </b></i></u></code> :)


Наверх

  Рейтинг@Mail.ru     Титульная страница Поиск, карта сайта Написать письмо