понедельник, 18 февраля 2008 г.

Семантический поиск



Рубрика Частная Практика. Статья На Ясном Глазу.

То, что компания ABBYY именует аббревиатурой NLC уже давным давно не "принципиально новая технология по анализу текстов на базе искуственного интеллекта". Дело даже не в том, что сама по себе идея семантического поиска - поиска "по смыслу" - отдает нафталином, а в том, что в настоящее время УЖЕ существуют и функционируют полностью готовые и работоспособные прототипы подобных систем. Например, интернет-поисковик Exactus (www.exactus.ru), разрабатываемый в Институте Системного Анализа (ИСА) РАН под руководством президента Российской Ассоциации Искусственного Интеллекта Осипова Г.С. Работы над данной поисковой системой начались примерно тогда же, когда ABBYY задумала свой NLC, - во второй половине 90х. С тех пор силами небольшого научного коллектива проект был доведен до сборки полностью работоспособного прототипа (в данный момент ведутся работы над построением собственного семантического индекса Рунета). Уже сейчас любой желающий может зайти на www.exactus.ru и помучать его запросами из серии "зачем Путин полетел в Париж". Правда пока качество возвращаемой выборки не всегда идеально из-за использования чужих индексов (Яндекс, Рамблер, Гугл), но при поиске в проиндексированных коллекциях текстов Exactus показывает лучшие результаты. Это подтверждается результатами ежегодного Российского Семинара По Оценке Методов Информационного Поиска (РОМИП), представляющего собой своеобразное "соревнование" поисковх машин. На РОМИП 2007 лучшие оценки независимых экспертов достались именно поисковику из ИСА.
Как ни парадоксально, но в данный момент основные проблемы в области семантического поиска лежат скорее в плоскости психологической, нежели в плоскости технологий. Дело в том, что современные "традиционные" поисковики настолько приучили нас к поиску по ключевым словам, что заставить кого-бы то ни было вводить длинные вопросительные запросы не под силу никакому "искуственному интеллекту", а без этого о полноценном семантическом поиске, т.е. поиске "по смыслу" можно забыть.

4 комментария:

Анонимный комментирует...

РОМИП - не соревнование и ИСА не может считаться победитель. Это абсолютно некорректное высказывние!

Каждый из участников ставит СВОИ эксперименты над своей системой, сравнение разных систем и подходов
на основе результатов такой оценки в общем-то не корректно.

Првктически ни один из участников представляющих коммерческие компании не участвует в РОМИП с
полной версией системы.

Прежде чем делать такие утверждения вам было бы полезно почитать материалы РОМИП и о РОМИП более внимательно! www.romip.ru

Konstantin Yakovlev комментирует...

Вы наверное прочитали что-то где-то между строк.

Какое именно высказывание поста Вы считаете некорректным?

Анонимный комментирует...

> представляющего собой своеобразное "соревнование" поисковх машин.

РОМИП НЕ соревнование


>На РОМИП 2007 лучшие оценки независимых экспертов достались именно поисковику из ИСА ...

Некорректно считать, что в РОМИП участвуют полноценные коммерческие решения. Это в большинстве случаев не так.

К тому же, вообще некорректно говорить что эксперты выставляют оценки поисковику ....

Roman G. комментирует...

Давно ничего не слышал об NLC.

Выпустила ли Abbyy свою более много лет вскармливаемую технологию?

Или денег не хватило и закрыли проект?