Система автоматического сбора данных интернет ресурсов и социальных сетей, и лингвистического анализа текстового содержимого в режиме реального времени
-

Описание проекта

Клиент-серверная система, которая обеспечивает обработку естественного языка в режиме реального времени.

Функциональность: 

Система предоставляет вычислительную платформу для лингвистического анализа цифрового содержания, чтобы вычислить отношение к входному набору ключевых слов или фраз. Цифровое содержание включает статические данные такие как: форумы, блоги, Twitter и сообщения чатов.

Технические особенности:

  • Целевая серверная платформа: Windows 2003 Server, Windows 2003 Server Cluster, IIS 6.0 and more.

  • Целевые браузеры: IE 7.0 and FireFox 2.0.

  • GUI фреймворк: ASP.Net 2.0.

  • Базы данных: SQL server, XML files, binary storage, full-text search index

  • Доступ к информации: ADO.Net, XML parsers

  • Доступ к веб-сервисам: SOAP web proxies

  • Доступ к Windows сервисам: WCF

  • GUI особенности: DHTML, AJAX and Flex

  • Ресурсы локолизации: resx files

Особенности бизнес-логики: 

  • Сервисы сбора данных, включая встраиваемый поисковый бот. 

  • Индексация и поиск, включая полнотекстовый поиск.  

  • Интеллектуальный поиск, включая лингвистический анализ и модули статистики. 

  • Web GUI включают Flex таблицы для визуализации статистических данных.

Ресурсы:

  • Сроки реализации (versions 1.0 - 1.4): октябрь 2008 - июль 2009 

  • Ресурсы: менеджер проектов, разработчики и тестировщики 

  • Методология разработки: адаптированный RUP

 

Для ознакомления с подобными проектами, перейдите на наш блог.