Справка - Поиск - Участники - Войти - Регистрация
Полная версия: Вычислительная мощность человеческого мозга
Частный клуб Алекса Экслера > Наука и техника
Страницы: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43
Голубая Собака
1 ноября 2014, 16:41

cruizer написал:
Прстой пример - чтобы дословно перевести например "catcher in the rye" много ума не надо, хватит словарика. Чтобы перевод был "над пропастью по ржи", нужно уже знать намного больше, проанализировать контекст, прикинуть вероятность с которой фраза будет именно названием книги а не чем-то другим, а для этого надо знать насколько известен автор, нонять о чём речь в тексте и т.д.

Ой, не-не-не...

Пока однажды, погожим или непогожим днем, один переводчик не перевел названия книги как "Над пропастью во ржи", такого соответствия не было - и не могло быть в словарях.

Тысячелетия развития человеческой мысли, столетия существования печатного текста вообще и словарей в частности, и ни в одном словаре - ни в одном - нету такого соответствия: catcher in the rye = над пропастью во ржи (пропасть во ржи - еще может быть... но я слабо представляю себе контекст, в котором бы такое странное выражение вообще бы попало в словарь... всё-таки это не какая-нибудь там "тележка колесная" или "плита газовая")

И только тогда, когда появилась связка "название книги на английском" = "ее удачный перевод на русском" (это надо было не только переводчику потрудиться и создать такую связку, а еще чтобы ее признали читатели - "да-ааа, это удачный, годный перевод, так теперь и оставим"), они пролезла и в словари.

Теперь любой человек, владеющий языком, может эту связку найти в словарях и интернетах и правильно употребить. Если вдруг какую-нибудь машину научить искать пары по словарям - думаю, что и машина при определенных обстоятельствах правильно идентифицирует - catcher in the rye - это именно "над пропастью во ржи", а не что-нибудь другое. Без каких-то сильных изысканий в области культуры и философии человечества вообще.
homo sapiens
1 ноября 2014, 18:00

Martin написал:
Результаты приведены например здесь:

Это не результаты, а реклама. Я вам могу взять любой переводчик (Google translate, Promt и т.д.) и подобрать для него предложение, которое он переведет идеально. Это не делает их переводы сопоставимыми с качеством перевода переводчика-человека.
Повторяю, когда они выпустят реальный продукт и я смогу вбить любой текст и посмотреть реальный результат, вот тогда и можно говорить о качестве перевода. Пока нет реального продукта разговор на эту тему не имеет смысла.
Rendom
2 ноября 2014, 19:33

homo sapiens написал: Повторяю, когда они выпустят реальный продукт и я смогу вбить любой текст и посмотреть реальный результат, вот тогда и можно говорить о качестве перевода.

В такой постановке задача не решаема. Вот недавний пример из жизни. На почте, где-то вдали от родины, турист общается с операционисткой на предмет отправить посылку. Общего языка у них нет и, в какой-то момент, язык жестов и энергичных кивков заводит в тупик. Даже бумажка с ручкой перестают работать. Тогда операционистка достает айпад, долго-долго вбивает в гугле фразу на своем, нажимает перевод на язык туриста. Тот наблюдает абракадабру. Потому что гугл вне контекста разговора наших героев.
Martin
2 ноября 2014, 21:57

Rendom написал: Потому что гугл вне контекста разговора наших героев.

+1.
homo sapiens
2 ноября 2014, 22:49

Rendom написал:
В такой постановке задача не решаема. Вот недавний пример из жизни. На почте, где-то вдали от родины, турист общается с операционисткой на предмет отправить посылку. Общего языка у них нет и, в какой-то момент, язык жестов и энергичных кивков заводит в тупик. Даже бумажка с ручкой перестают работать. Тогда операционистка достает айпад, долго-долго вбивает в гугле фразу на своем, нажимает перевод на язык туриста. Тот наблюдает абракадабру. Потому что гугл вне контекста разговора наших героев.

Машинный переводчик, хотя бы в контексте нормально бы переводил. Он и в контексте этого делать не может. Возьмем, например, достаточно толстую книгу и начнем ее читать. Человек, если книга достаточно толстая, из прочитанного текста поймет контекст, например, художественная это книга или учебник и т.д. Дайте компьютеру перевести эту же толстую книгу, результат будет плачевен. Компьютер в принципе из текста не сможет понять контекст, во всяком случае на текущем уровне развития программ перевода текста, может когда-нибудь поймет.
P.S. Резюмируя. Разница между человеком и компьютером (на текущий момент) при переводе текста в том, что человек может не понять контекст из-за нехватки информации, но при достаточном количестве информации он способен понять контекст. Программы перевода в принципе (на текущий момент) не способны понять контекст при любом количестве информации.
Лунный Волк
2 ноября 2014, 23:38

homo sapiens написал:
Rendom написал:
Программы перевода в принципе (на текущий момент) не способны понять контекст при любом количестве информации.

А что такого сакрального в контексте?
homo sapiens
2 ноября 2014, 23:42

Лунный Волк написал:
А что такого сакрального в контексте?

Да ничего особенного. Просто для перевода слова нужно обязательно знать контекст, в разных контекстах слово переводиться по разному. На это и намекал, Rendom, в своем посте, если я его правильно понял. Он оправдывал неспособность программ правильно переводить отсутствием достаточной информации о контексте. На что я ему возразил, что человек способен понять текст, в том числе и контекст, а программа на это не способна, во всяком случае пока.
Лунный Волк
3 ноября 2014, 09:54

homo sapiens написал: а программа на это не способна, во всяком случае пока.

Я прицепился за то, что

не способны понять контекст при любом количестве информации.

Это не совсем так. Контекст словосочетания определить достоверно практически нереально, предложения уже проще, а достаточно длинного текста сравнительно просто. Ведь из текста предстоит извлечь ничтожно малое количество информации, что на длинном тексте будет осуществляться с очень малой вероятностью ошибки. Понятно, что все доступные человеку нюансы определения смыслов покрыть сейчас нереально, но для практики хватит.
"Всего-то" контекстно индексировать словари, а там уж хоть обучение, хоть жесткие алгоритмы принятия решений.
Если бы была потребность это давно бы сделали.
cruizer
3 ноября 2014, 12:04

Голубая Собака написала:
Теперь любой человек, владеющий языком, может эту связку найти в словарях и интернетах и правильно употребить. Если вдруг какую-нибудь машину научить искать пары по словарям - думаю, что и машина при определенных обстоятельствах правильно идентифицирует - catcher in the rye - это именно "над пропастью во ржи", а не что-нибудь другое. Без каких-то сильных изысканий в области культуры и философии человечества вообще.

Я конечно же имел в виду теперь, когда перевод названия книги на русский уже устоялся. Смысл в том, что переводить нужно понимая контекст. Например если речь о бейсболе, с то большей вероятностью эту фразу надо переводить дословно и книга здесь ни при чём. Ещё есть названия фильмов, неоднозначные аббревиатуры и прочее, что в отрыве от контекста непереводимо даже человеком.
homo sapiens
3 ноября 2014, 12:07

Лунный Волк написал:
Контекст ... определить ...достаточно длинного текста сравнительно просто. "Всего-то" контекстно индексировать словари, а там уж хоть обучение, хоть жесткие алгоритмы принятия решений.
Если бы была потребность это давно бы сделали.

Не знаю о потребностях, но в машинных переводчиках способность к определению контекста я не замечал. Разницы между переводом короткого предложения и крупного текста я не наблюдал, в обоих случаях переводы "кривые". Может действительно это не нужно, хотя для меня это звучит странно, а может не все так просто, как кажется на первый взгляд.
cruizer
3 ноября 2014, 12:13

Martin написал:
Результаты приведены например здесь:

Статистический переводчик лучше обычного, но он тоже далеко не совершенен.
Чтобы хорошо переводить, нужно понимать смысл текста, а до этого системам перевода судя по всему очень далеко. Основой плюс статистического перевода в том что переводчик может сам настроиться на любую пару языков, как делает google translate например.
cruizer
3 ноября 2014, 12:15

homo sapiens написал:
Не знаю о потребностях, но в машинных переводчиках способность к определению контекста я не замечал. Разницы между переводом короткого предложения и крупного текста я не наблюдал, в обоих случаях переводы "кривые". Может действительно это не нужно, хотя для меня это звучит странно, а может не все так просто, как кажется на первый взгляд.

Нужно конечно, но это сложно сделать. Нельзя просто сгенерировать словарь с учётом контекста. Вероятностные модели тут не подойдут, слишком огромный объём обучающих текстов понадобится, слишком большие и не универсальные будут словари.

cruizer
3 ноября 2014, 12:20
Интересно, а пробовал ли кто-нибудь научить компьютер понимать язык, не программируя лексические правила и прочее? Начать с базовых примитивов - отдельные буквы, слоги, звуки, ассоциации, и заставить такую модель научиться думать и разговаривать хотя бы на простейшем уровне.
Это вполне реально, мне кажется.
homo sapiens
3 ноября 2014, 12:54

cruizer написал:
Нужно конечно, но это сложно сделать. Нельзя просто сгенерировать словарь с учётом контекста. Вероятностные модели тут не подойдут, слишком огромный объём обучающих текстов понадобится, слишком большие и не универсальные будут словари.

Я думаю, что основная проблема перевода даже не в контексте, хотя это важно, а в понимании. Из понимания текста возникает понимание контекста. Машинные переводчики, на нынешнем этапе развития, не понимают текст, отсюда все вытекающие последствия. Почему перевод так важен для ИИ? Он важен, потому что без понимания текста (чтобы это ни значило) очень сложно сделать хороший перевод, а мы и хотим от ИИ добиться моделирования понимания. Перевод - это на самом деле изложение (а то и сочинение) текста. Переводчик читает текст, понимает его, а потом пересказывает его своими словами на другом языке. Причем чем больше на переводчика накладывается ограничений (размер предложений, наличие или отсутствие рифмы и т.д.) тем меньше там изложения и больше сочинения. Предельный случай сочинения - это перевод стихов.
Rendom
3 ноября 2014, 13:25

homo sapiens написал: Он оправдывал неспособность программ правильно переводить отсутствием достаточной информации о контексте. На что я ему возразил, что человек способен понять текст, в том числе и контекст, а программа на это не способна, во всяком случае пока.

Я не в курсе последних достижений. Полагаю, проблема в неспособности электронных переводчиков гугла выделять контекст из окружающего пространства. Ведь надо заранее доставать планшет, и делать его полноправным участником разговора. Только тогда у переводчика будет шанс "врубиться" и начать переводить точнее.
homo sapiens
3 ноября 2014, 13:32

Rendom написал:
Ведь надо заранее доставать планшет, и делать его полноправным участником разговора. Только тогда у переводчика будет шанс "врубиться" и начать переводить точнее.

Вы говорите, что в разговоре нельзя полагаться на автоматический перевод, так как компьютеру неизвестен контекст.Я с вами согласен, но у меня возникло возражение, что при переводе толстой книги, ее контекст понятен из самого текста этой книги. Поэтому следуя вашей логике перевод достаточно длинного текста, а не фраз из разговора, должен компьютером делаться хорошо, но он его делает плохо. Поэтому ваши аргументы здесь не работают. И уже закончим с вашим частным случаем беседы двух людей на улице. smile.gif
P.S. Как я уже говорил ранее, основная проблема компьютерного перевода, что компьютер сейчас в принципе не понимает смысла текста, а без этого хорошие переводы очень маловероятны.
cruizer
3 ноября 2014, 13:50

homo sapiens написал:
Я думаю, что основная проблема перевода даже не в контексте, хотя это важно, а в понимании. Из понимания текста возникает понимание контекста. Машинные переводчики, на нынешнем этапе развития, не понимают текст, отсюда все вытекающие последствия.

Так я согласен. Вопрос в том, что с этим делать smile.gif Статистический перевод неплохо переводит тексты которые укладываются в такую статистически усреднённую модель. Но как только текст немного выходит за рамки, такая модель в принципе не может выдать хороший результат. Точнее может, но сложность переводчика будет расти экспоненциально. Нужны другие подходы.
homo sapiens
3 ноября 2014, 13:56

cruizer написал:
Так я согласен. Вопрос в том, что с этим делать smile.gif  Статистический перевод неплохо переводит тексты которые укладываются в такую статистически усреднённую модель. Но как только текст немного выходит за рамки, такая модель в принципе не может выдать хороший результат. Точнее может, но сложность переводчика будет расти экспоненциально. Нужны другие подходы.

Не тому человеку вы эти вопросы задаете. Если бы я это знал, то я бы уже наверное был миллиардером. biggrin.gif
Голубая Собака
3 ноября 2014, 14:20

cruizer написал:
Я конечно же имел в виду теперь, когда перевод названия книги на русский уже устоялся. Смысл в том, что переводить нужно понимая контекст. Например если речь о бейсболе, с то большей вероятностью эту фразу надо переводить дословно и книга здесь ни при чём. Ещё есть названия фильмов, неоднозначные аббревиатуры и прочее, что в отрыве от контекста непереводимо даже человеком.

А теперь достаточно поиграться с тем же ГуглоТранслейтом.

Вбиваем в строке оригинального текста "catcher in the rye", смотрим, как на противоположной стороне меняется перевод по мере того, как мы печатаем. 3d.gif
(радостно обозреваем то, что получилось, когда мы напечатали).

Потом можно дописать что-нибудь вроде I read catcher in the rye. Понаблюдать, что программа сделает с переводом, куда она что поставит.

Дописать I read catcher in the rye yesterday, посмотреть, куда она поставит "вчера".

Такие простенькие задания (на уровне наших учеников класса второго-третьего) безмозглая машина вполне уже расщелкивает.

Дело в том, что catcher in the rye - это как раз неудачный пример на контексты: в большинстве контекстов мы будем, скорее всего, иметь в виду книгу. А книге уже придумали название. Назвал бы ее переводчик "Пропасть во ржи", а не "Над пропастью..." - говорили бы в И.п. как миленькие.

(про голого кондуктора, который бегает под вагонами - и то гораздо лучший пример на контексты, потому что тут уже одним устоявшимся выражением не обойтись).

Заметьте, про интеллект я тут сейчас вообще не говорю: он тут вне контекста biggrin.gif
v-groove
3 ноября 2014, 14:29
Так просто, прикола ради, провел маленький тестик перевода через Bing Translator. Вспомнил, что MS там что-то тоже мутит с машинным переводом и решил глянуть, как там у них дела. Тестик на банальное распознование, в зависимости от контекста, семантики слова "лук". Все примеры вводил маленькими буквами без знаков препинания. Ну и ниже результат.

1. хозяйка чистила лук -> the hostess was cleaning onions
2. солдат выстрелил из лука -> the soldiers shot from a bow
3. хозяйка чистила лук из которого стрелял солдат -> the hostess was cleaning the bow from which the shot soldier
4. сподвижником павла был святой лука -> Paul's Companion was Saint Luke

В простейших случаях чего-то таки распознается. smile.gif
Голубая Собака
3 ноября 2014, 14:36

Лунный Волк написал:
А что такого сакрального в контексте?

В нем целая вселенная

Важен для понимания текста. Настолько, что и человеко-переводчики не торопятся переводить своим непереводческим коллегам куски текста, оторванные от контекста.

Вопрос в каком-нибудь нашпигованном работничками офисе: "а-а-а, народ, быстренько, что такое naked conductor?" вызовет единственно правильный ответный вопрос: "где?" (в смысле, "в каком контексте?", "где ты это встретил?").

По идее, тем же самым вопросом должен задаваться и компьютер biggrin.gif
homo sapiens
3 ноября 2014, 14:39

v-groove написал:
1. хозяйка чистила лук -> the hostess was cleaning onions

В простейших случаях чего-то таки распознается. smile.gif

Я конечно не специалист в английском языке, но у меня сомнение, что "чистить лук" нужно переводить как "cleaning onions". Cleaning - это несколько иное, мне кажется.
v-groove
3 ноября 2014, 14:49

homo sapiens написал:
Я конечно не специалист в английском языке, но у меня сомнение, что "чистить лук" нужно переводить как "cleaning onions". Cleaning - это несколько иное, мне кажется.

Фиг знает. По крайней мере лук с луком и Лукой не путает. По крайней мере иногда. smile.gif
Голубая Собака
3 ноября 2014, 14:57

homo sapiens написал:
Я думаю, что основная проблема перевода даже не в контексте, хотя это важно, а в понимании.

Ага, короче, опять уперлись в интеллект.


Rendom написал: Ведь надо заранее доставать планшет, и делать его полноправным участником разговора. Только тогда у переводчика будет шанс "врубиться" и начать переводить точнее.

Не, пока не будет.

   Спойлер!
Было дело, ленилась однажды по клавишам щелкать. Вставляю то ли в Яндекс, то ли в Гугль увесистый кусок текста. Что-то про комплект документации для строительства. Сейчас уже не помню, где у меня этот кусок, а то бы нагляднее получилось. В общем, в переводе всё вроде благопристойненько, ну там типичные ошибки типа "чей туфля - моё", порядок слов, тема-рема... ну всё как обычно. Где-то в середине текста спотыкаюсь: в оригинале звучит что-то вроде "Том такой-то содержит сведения..." или чертеж там какой-то, не помню уже. Получаю в переводе, что Том - имя собственное, а не "том комплекта проектной документации", чуть ли не Thomas там в переводе стоит 3d.gif

Переводчику-человеку надо ну очень много выпить, чтобы так налажать.
Программе в принципе скормили достаточно приличный кусок текста, и если бы она "понимала" его в связанном виде, а не как отдельные блоки информации, она бы поняла, что здесь Том - это про документы, а дядюшка Том там никаким боком. Потому что ВСЁ в контексте на это указывает, для человеко-переводчика он полностью однозначен... а вот компьютер нашел альтернативный вариант biggrin.gif

Кстати, в связных кусках текста такие явные нечеловеческие особенности вылезают еще нагляднее, чем в коротеньких предложениях.

Да у меня был случай, когда переводчик умудрился из большого массива текста так и не уцепить контекст... Но там, когда анализируешь, можно понять, откуда ошибка вылезла... может быть даже оттуда, что несмотря на большой, около 100 страниц, объем текста контекст одного сочетания всё равно нигде не считывался однозначно. Так тоже бывает.

Вот в таком случае - это уже опять про интеллект.
Голубая Собака
3 ноября 2014, 15:10

homo sapiens написал:
Я конечно не специалист в английском языке, но у меня сомнение, что "чистить лук" нужно переводить как "cleaning onions". Cleaning - это несколько иное, мне кажется.

А это уже не совсем о контексте, а о сочетаемости слов.
(и немного - вопрос о том же нашем злосчастном понимании, что конкретно происходит. Если перед этим авоська с луком оборвалась и шлепнулась в лужу - там должно быть что-то вроде washing. Cleaning действительно у меня ни в какой контекст не лезет. Если же с луком всё в порядке, а нам его надо в рагу - мы его скорее всего будем peeling)
cruizer
3 ноября 2014, 15:10

Голубая Собака написала:
А теперь достаточно поиграться с тем же ГуглоТранслейтом.

Вбиваем в строке оригинального текста "catcher in the rye", смотрим, как на противоположной стороне меняется перевод по мере того, как мы печатаем.  3d.gif
(радостно обозреваем то, что получилось, когда мы напечатали).

Потом можно дописать что-нибудь вроде I read catcher in the rye. Понаблюдать, что программа сделает с переводом, куда она что поставит.

Дописать I read catcher in the rye yesterday, посмотреть, куда она поставит "вчера".

Такие простенькие задания (на уровне наших учеников класса второго-третьего) безмозглая машина вполне уже расщелкивает.

Дело в том, что catcher in the rye - это как раз неудачный пример на контексты: в большинстве контекстов мы будем, скорее всего, иметь в виду книгу. А книге уже придумали название. Назвал бы ее переводчик "Пропасть во ржи", а не "Над пропастью..." - говорили бы в И.п. как миленькие.

(про голого кондуктора, который бегает под вагонами - и то гораздо лучший пример на контексты, потому что тут уже одним устоявшимся выражением не обойтись).

Заметьте, про интеллект я тут сейчас вообще не говорю: он тут вне контекста  biggrin.gif

Похоже что безмозглая машина всегда думает что catcher in the rye это книга

What does catcher in the rye do? => Что пропастью во ржи делать?
Who is that catcher in the rye? => Кто что пропастью во ржи?
The catcher in the rye runs too fast => Над пропастью во ржи вращается слишком быстро

facepalm.gif
Голубая Собака
3 ноября 2014, 16:27

cruizer написал: What does catcher in the rye do?  => Что пропастью во ржи делать?

А ведь действительно - что же этой пропастью, черт возьми, делать?

(похожие вопросы, помнится, задавал Чернышевский... страшно далеки они от народа 3d.gif ).

Вот уж ва-и-стену facepalm.gif

(А всё-таки обратите внимание, как достаточно неплохо машина управляется со структурой предложения... кто на ком стоял худо-бедно "понимает")
Rendom
3 ноября 2014, 16:46

homo sapiens написал: Я с вами согласен, но у меня возникло возражение, что при переводе толстой книги, ее контекст понятен из самого текста этой книги. Поэтому следуя вашей логике перевод достаточно длинного текста, а не фраз из разговора, должен компьютером делаться хорошо, но он его делает плохо.

Не могу поверить на слово. smile.gif
homo sapiens
3 ноября 2014, 17:53

Rendom написал:
Не могу поверить на слово. smile.gif

Не надо мне верить. Думаю существуют люди, которым нравиться машинный перевод. Ты, я думаю относишься к их числу.
Переводите книги google translate'ом и не пользуйтесь профессиональным переводом. Получайте удовольствие от перевода google translate. biggrin.gif
Google - качественный перевод в каждый дом. На правах рекламы. biggrin.gif
Голубая Собака
3 ноября 2014, 20:28

homo sapiens написал: Думаю существуют люди, которым нравиться машинный перевод.

Существуют люди, которые просто тупо научились пользоваться машинным переводом в своих целях.

Отверткой банки открывать.

Закинуть книгу в мясорубку, потом полученное допилить напильником.
Да и тупо понять "о чем говорится в этом письме" бывает тоже для чего-то нужно.
v-groove
3 ноября 2014, 21:47

cruizer написал:
Похоже что безмозглая машина всегда думает что catcher in the rye это книга
facepalm.gif

Я, кстати, совсем не уверен, что человек-переводчик тоже бы пропустил в твоих вопросах странную аллюзию на вполне конкретную книгу. Все-таки это вполне узнаваемое словосочетание. Посему и от человека можно ожидать странных переводов, в попытке сохранить эту двусмысленность. Ты намеренно использовал известное словосочетание, но мысленно хочешь получить подстрочник без учета возможного второго смысла. Тут скорее нужна даже не машина-переводчик, а машина-телепат. smile.gif
Голубая Собака
3 ноября 2014, 22:17

v-groove написал:
Тут скорее нужна даже не машина-переводчик, а машина-телепат.  smile.gif

Хочу такую.
Очень.
Помогала бы в некоторых случаях телепать, "что хотел сказать аффтар".

(А я бы удвоила производительность 3d.gif )
Martin
24 ноября 2014, 14:30
Вести с полей искусственного интеллекта: Суперкомпьютер IBM Watson станет отдельным подразделением корпорации с бюджетом в 1 миллиард долларов. (новость, точнее, старость от 15 января 2014.)

   Спойлер!
Совсем недавно на Хабре уже публиковалась статья о том, что IBM открывает инструментарий суперкомпьютера IBM Watson для сторонних разработчиков. Теперь компания пошла дальше, и выделила IBM Watson в собственное подразделение, с дополнительным вложением средств.

Само собой, здесь имеется в виду не только сам суперкомпьютер, и но и команда его разработчиков, обслуживающего персонала и всех прочих. На развитие такого подразделения компания решила выделить 1 миллиард долларов, из которых десятая часть, 100 миллионов долларов, пойдет на создание «экосистемы» приложений и сервисов для IBM Watson.

Собственно, эти 100 миллионов выделены для формирования венчурного фонда, выделяющего инвестиции стартапам и компаниям, которые и будут разрабатывать приложения/сервисы для суперкомпьютера. Корпорация делает все это не просто так, а с оглядкой на прогноз исследовательской компании Gartner. По данным компании, в ближайшее время «умные» машины станут ключевым фактором прорыва в информационных технологиях, помогая людям «делать невозможное» и работать более эффективно.



О серьезности намерений IBM говорит не только сумма в 1 миллиард долларов, но и планируемое количество сотрудников нового отдела в 2000 человек. В число работников войдут как непосредственные служащие IBM, так и отраслевые эксперты, которые помогут оценивать отдельные направления работы, включая здравоохранение, финансовые услуги, розничная торговля, туризм и телекоммуникации.

Новое подразделение так и будет называться: IBM Watson Group. Главой подразделения станет старший вице-президент IBM Software Solutions Group Майкл Родин (Michael Rhodin).



Кроме всего прочего, задачей IBM Watson Group будет являться поддержка и развитие трех новых сервисов.

1. IBM Watson Discovery Advisor. Это направление, прежде всего, направлено на поддержку фармацевтических исследований. Сервис поможет компаниям, разрабатывающим новые фармацевтические препараты, анализировать большие массивы данных исследований с установлением логических связей. Вероятно, все это поможет проводить исследования в указанной сфере значительно быстрее.

2. IBM Watson Analytics. Второе направление — визуализация больших массивов данных. Сервис поможет компаниям гораздо быстрее обрабатывать массивы данных, чем в обычном случае. Суперкомпьютер будет устанавливать логические связи между анализируемыми массивами данных, представляя результат в простом визуальном виде.

3. IBM Watson Explorer. Сервис предлагает единые стандарты в сфере разработки информационно-ориентированных приложений, которые предоставляют комплексный контекстно-зависимый обзор любой темы, релевантной для бизнес-пользователей и специалистов по обработке данных.

Собственно, все это будет завязано вокруг бизнес-инкубатора, в котором, по плану, будут появляться технологии, средства разработки и кадровый потенциал для создания и запуска новых решений на базе когнитивной системы Watson в облачной среде.



Для участников проекта подразделение Watson Group будет проводить тренинги, семинары, рабочие встречи, в которых будут участвовать ученые, бизнесмены, политики ИТ-специалисты. Масштабы таких встреч велики — по плану, к участию в них планируется привлечь более 1000 академических организаций.

Стоит также напомнить, что проект IBM Watson Developers Cloud продолжает работать и развиваться, теперь уже в рамках нового подразделения. Как и раньше, для участия в проекте следует подавать заявку, которая будет затем рассматриваться «жюри» проекта..

Сейчас все эти проекты находятся только в начале пути, и для их развития является ценным каждый участник, как компания, так и разработчик или ученый. Так что к сотрудничеству приглашаются все, кому интересна работа с IBM Watson и его расширяющейся «экосистемой».
Martin
17 декабря 2014, 23:15
На Хабре появилась интересная статья про Compreno, онтологии и т.д.: Онтоинженер: работа по понятиям.
Martin
19 декабря 2014, 18:07
В Википедии есть статья Теория "Смысл-Текст" про историю работ по машинному переводу в СССР (под руководством Мельчука).
Так что компьютерная лингвистика может оказаться рискованной областью, в ней и признанные корифеи терпели неудачу.
Martin
20 декабря 2014, 20:11
Помимо ABBYY существуют еще компании, занимающиеся компьютерной лингвистикой: RCO.
cruizer
24 декабря 2014, 16:38

Martin написал: В Википедии есть статья Теория "Смысл-Текст" про историю работ по машинному переводу в СССР (под руководством Мельчука).
Так что компьютерная лингвистика может оказаться рискованной областью, в ней и признанные корифеи терпели неудачу.

Это мало о чём говорит.
Во времена СССР не было интернета, и компьютеры были послабее. Поэтому все эти теории грамматик не слишком привязаны к реальности. Я когда-то этим занимался. Из 2-х толстенных томов реально полезными оказались пару десятков страниц о регулярных выражениях. Остальное было слишком теоретизированно, и работало для каких-то сказочных грамматик с кучей ограничений. Поэтому когда стала задача написать нечто вроде компилятора, пришлось придумать свой метод и просто запрограммировать чтобы работало smile.gif

Сейчас, имхо, подход к таким задачам вообще другой. Не нужно пытаться формализовать структуру языка, закодировать сотни правил, исключений и прочее. Намного проще написать систему, которая сделает это сама.
alibek
24 декабря 2014, 16:52
У меня такой вопрос.
Допустим, мы берем мозги приговоренных к казни преступников, сажаем в банки и ставим перед этими мозгами какие-то частные задачи, с которыми пока ИИ не справляется. Или, чтобы не отвлекаться на мозги в банке, берем целых преступников, сажаем в капсулы и обкалываем препаратами, глушащими сознание. Это будет базовый элемент для решения какой-нибудь частной задачи.
Затем эти базовые элементы тренируются/обучаются по областям, в рамках которых будут решаться задачи. Скажем один элемент отличает живое от неживого, другой опознает животных-млекопитающих, третий опознает людей, четвертый делает классификацию по внешним признакам (высокий/низкий, старый/молодой) и т.п.
Наберется у нас несколько тысяч таких элементов, управлять этими элементами будет компьютерная система, которая будет классифицировать такие информацию с помощью биоэлементов и осуществлять какую-то обработку этих данных.
Можно будет такую систему приравнять к ИИ? Или ИИ должен быть обязательно синтетическим?
Martin
24 декабря 2014, 18:04

alibek написал: Можно будет такую систему приравнять к ИИ? Или ИИ должен быть обязательно синтетическим?

Получатся киборги - полусинтетические, полубиологические мозги. Нам интересно создать полностью синтетические мозги, чтобы они хотя бы как минимум повторяли работу всех 87 млрд. человеческих нейронов и 100 трлн. связей между ними. Но пока это невозможно (и будет ли возможно в ближайшие 100 лет, неизвестно).
Martin
24 декабря 2014, 19:21

cruizer написал: Сейчас, имхо, подход к таким задачам вообще другой. Не нужно пытаться формализовать структуру языка, закодировать сотни правил, исключений и прочее. Намного проще написать систему, которая сделает это сама.

Все равно в КЛ требуется офигенная трудоемкость при написании кода. Почитай комментарии к Статье на Хабре "Онтоинженер: работа по понятиям":

Compreno — классная штука, но оторопь берёт не только меня, когда начинаешь понимать, сколько ручного труда требует её применение. Очень интересно услышать «истории успеха» внедрения Compreno в жизнь.

Лунный Волк
24 декабря 2014, 19:23

cruizer написал: Сейчас, имхо, подход к таким задачам вообще другой. Не нужно пытаться формализовать структуру языка, закодировать сотни правил, исключений и прочее. Намного проще написать систему, которая сделает это сама.

Мне тоже так кажется гораздо проще танцевать от максимально полного массива тематических текстов, который по современным меркам не так уж и велик.
homo sapiens
24 декабря 2014, 19:30

cruizer написал:
Намного проще написать систему, которая сделает это сама.

Не проще, просто по другому не получается. Я уж не говорю о том, что самообучающиеся системы непредсказуемы, никогда не знаешь чему они научаться на примерах.
Цитата из википедии:
"Даже в случае успешного, на первый взгляд, обучения сеть не всегда обучается именно тому, чего от неё хотел создатель. Известен случай, когда сеть обучалась распознаванию изображений танков по фотографиям, однако позднее выяснилось, что все танки были сфотографированы на одном и том же фоне. В результате сеть «научилась» распознавать этот тип ландшафта, вместо того, чтобы «научиться» распознавать танки"
Martin
24 декабря 2014, 19:37

Лунный Волк написал:
Мне тоже так кажется гораздо проще танцевать от максимально полного массива тематических текстов, который по современным меркам не так уж и велик.

Работа с корпусами текстов?
Лунный Волк
24 декабря 2014, 20:10

Martin написал: Работа с корпусами текстов?

Собственно с текстами поодиночке, естественно.
cruizer
25 декабря 2014, 01:22

Martin написал:
Все равно в КЛ требуется офигенная трудоемкость при написании кода. Почитай комментарии к Статье на Хабре "Онтоинженер: работа по понятиям":

Насколько я понимаю, в Compreno они именно вручную описывают структуру языка и все категории понятий, поэтому и сложность офигенная.

Мне другое интересно - можно ли сегодня заставить компьютер изучить язык самостоятельно. Чтобы подать на вход текст, а он пусть сам разбирается где буквы, знаки препинания, слова, иероглифы или ещё что. Начинать понемногу разумеется - отдельные слова, понятия, чтобы формировать ассоциации правильные. Примерно как ребёнка разговаривать учат. Мне кажется, этот процесс не слишком сложно формализуем, а результаты могут получиться интересные.
cruizer
25 декабря 2014, 01:25

homo sapiens написал:
Не проще, просто по другому не получается. Я уж не говорю о том, что самообучающиеся системы непредсказуемы, никогда не знаешь чему они научаться на примерах.
Цитата из википедии:
"Даже в случае успешного, на первый взгляд, обучения сеть не всегда обучается именно тому, чего от неё хотел создатель. Известен случай, когда сеть обучалась распознаванию изображений танков по фотографиям, однако позднее выяснилось, что все танки были сфотографированы на одном и том же фоне. В результате сеть «научилась» распознавать этот тип ландшафта, вместо того, чтобы «научиться» распознавать танки"

Конечно, правильно обучить - это существенная часть работы. Для человеческого интеллекта то же самое.
Лунный Волк
25 декабря 2014, 01:45

cruizer написал:
Мне другое интересно - можно ли сегодня заставить компьютер изучить язык самостоятельно. Чтобы подать на вход текст, а он пусть сам разбирается где буквы, знаки препинания, слова, иероглифы или ещё что. Начинать понемногу разумеется - отдельные слова, понятия, чтобы формировать ассоциации правильные. Примерно как ребёнка разговаривать учат. Мне кажется, этот процесс не слишком сложно формализуем, а результаты могут получиться интересные.

В такой постановке у компьютера огромное преимущество перед ребенком - он может оперировать с огромными массивами текста. Собственно буквы ему не особо и нужны, если ему не придется говорить. wink.gif
Martin
25 декабря 2014, 15:41

Лунный Волк написал:
В такой постановке у компьютера огромное преимущество перед ребенком - он может оперировать с огромными массивами текста. Собственно буквы ему не особо и нужны, если ему не придется говорить.  wink.gif

Вроде бы на этом основана работа IBM Watson.
Лунный Волк
25 декабря 2014, 20:00

Martin написал: Вроде бы на этом основана работа IBM Watson.

Ага. Для компа уже выгоднее иметь единицей не букву, а слово или даже семантическую(?) конструкцию.
cruizer
27 декабря 2014, 01:46

Лунный Волк написал:
Ага. Для  компа  уже выгоднее иметь единицей не букву, а слово или даже семантическую(?) конструкцию.

Буквы нужны чтобы правильно читать и писать. Как без них обойтись? Запросы и базу в виде семантических конструкций кому-то всё равно придётся делать.
Дальше >>
Эта версия форума - с пониженной функциональностью. Для просмотра полной версии со всеми функциями, форматированием, картинками и т. п. нажмите сюда.
Invision Power Board © 2001-2016 Invision Power Services, Inc.
модификация - Яро & Серёга
Хостинг от «Зенон»Сервера компании «ETegro»