Blinkx разработала систему поиска видео в Интернете.
В настоящее время, по статистике английской компании CacheLogic, передача видео уже составляет 60% общего трафика Сети.
Однако поисковые системы, созданные еще в «текстовую эпоху» интернета, плохо справляются с поиском видео. Это связано с тем, что они не ищут видео как таковое, а анализируют информацию, связанную с ним. К последней относится текст на странице, где размещено видео, метаданные (например, ключевые слова), суффиксы видео (.mpeg или .avi), титры и субтитры. Ни один из этих подходов не является удовлетворительным. Так, например, многие видеоклипы в Сети не имеют сопроводительного текста, а зачастую и метаданных.
Решение задачи поиска видео предлагает Суранга Чандратиллак (Suranga Chandratillake), сооснователь компании Blinkx, Сан-Франциско. Его методика не отрицает уже существующих методов, но предполагает расшифровку слов, произносимых в видеозаписи, и осуществление поиска по ним. Это является большим достижением, так как эффективное распознавание речи является сложной задачей.
Технология распознавания Blinkx основана на нейронных сетях и машинном обучении с использованием «скрытых моделей Маркова» (hidden Markov models), методе статистического анализа, когда скрытые параметры угадываются из уже известной информации. Сам Чандратиллак называет такой метод «поиском, зависящим от контекста». Он отмечает, что успешность именно такого подхода связана с тем, что значения произносимых слов неясны, если их анализировать по отдельности. Поэтому система Blinkx использует всю имеющуюся информацию о том, в каком контексте может появляться то или иное слово, а также все сведения о конкретном клипе.
Несмотря на всю новизну проекта, у Blinkx существует, как минимум, три препятствия. Во-первых, из-за того, что сервис Google Video не столь хорош сейчас, не значит, что он не станет лучше. Во-вторых, даже если Google не сможет создать систему поиска видео, в этой области уже существует большая конкуренция: TruVeo, Flurl, ClipBlast и другие компании. В-третьих, Blinkx может и не продвинуться далеко в анализе видеофайлов, так как данная система анализирует только звуки, но не изображение. Последнее препятствие является самым серьезным.