Кто есть кто в робототехнике. Выпуск I. Компоненты и решения для создания роботов и робототехнических систем - страница 6



Кроме того, приемлемый процент распознавания достигался при изменении ракурса лица примерно на 20 %.

На рис. 2.2 показаны особенности поиска по изображению человека. Маленький кадр в левом нижнем углу – изображение-запрос. Верхняя линейка кадров – результат поиска с указанием степени близости результата к запросу: «100 %» здесь относятся к кадру, использованному в качестве запроса; рядом с числом процента – названия видеоматериалов, содержащих данные кадры.

Рис. 2.2


Для работающего с Excalibur оператора исследуемый массив предстаёт в виде двух мультимедийных составляющих: картинки и текста. Текст – это фоновый код для поиска видеоизображения, поэтому в ранее рассмотренном процессе редактирования большое значение имеет вычленение текстового материла из видеозаписи (этот же текстовый материал при необходимости ложится в основу субтитров). Поиск проиндексированной видеоинформации, уже хранящейся в VideoAsset Server, осуществляется как по кадрам из StoryBoard при помощи ПО Visual RetrievalWare, так и по тексту (субтитры, название и пр.) при помощи RetrievalWare – профессиональной системы управления знаниями. В частности, в версии 7.0 этой системы, имеющей графические словари (рис. 2.3), мультимедийные запросы могут формироваться по следующим принципам: слова и изображения смешаны в одном запросе; объединение слов и изображений в сложное логическое выражение; при ранжировании результатов поиска учитываются и слова, и изображения. На рис. 2.4 приведён пример сложного поиска.

Конец ознакомительного фрагмента.

Если вам понравилась книга, поддержите автора, купив полную версию по ссылке ниже.

Продолжить чтение