Система интеллектуального анализа, оценки и категоризации контента чатов и сообщений в режиме реального времени
-

Описание проекта

Разработка заказной системы, которая обеспечивает интеллектуальный анализ входных текстов, чатов и сообщений для поиска желаемого содержимого определенного экспертами.

Функциональность

  • Ресурсная база анализа. Эксперты системы создают ресурсную базу для анализа с использованием программы с графическим интерфейсом, а также задают желаемые критерии поиска: слова/фразы, экспертные значения, категории и языки.

  • Модуль анализа. Система имеет отдельный модуль анализа, который представляет собой кросс-платформенную компоненту для использования в высоко-нагруженных системах в режиме реального времени. Компонент обрабатывает и анализирует входящий текст и возвращает найденное содержимое, которое было определено экспертами.

  • Пользовательские параметры. Система имеет набор дополнительных входных параметров, таких как пользовательские слова\фразы и уровень чувствительности. Она возвращает список найденных текстовых фрагментов с детальной информацией: язык, частотность, категория и набор терминов.

Технические особенности:

  • Целевые платформы:  Windows, Linux, Mac OS 

  • Источники данных: Binary storage

  • Технологии программирования: Cross-platform C++, stl

  • Программная оболочка: Managed C++ для .Net, JNI для Java

Особенности бизнес-логики:

  • Поиск необходимых данных в исходных документах. 

  • Высокоэффективный парсинг и анализ. 

  • Возврат найденных фрагментов текста с детальной информацией: язык, сходимость, категории и наборы терминов.

Управление и ресурсы:

  • Сроки реализации: (versions 1.0 - 1.3): сентябрь 2009 - август 2010 

  • Ресурсы: руководитель,  аналитики, команда разработки и тестирования

  • Методология разработки: Agile

Для ознакомления с подобными проектами, перейдите на наш блог.