Name: Подпись к изображению
Price: 53.10 EUR
Availability: InStock
Author: Канчана Каннаиян/Меенатчи Р
ISBN: 9786207661022

Inicio > Economía, finanzas, empresa y gestión > Empresa y gestión > Подпись к изображению

Editorial:: KS OmniScriptum Publishing
Año de edición:: 2024
Materia: Empresa y gestión
ISBN:: 9786207661022

53,10 €

IVA incluido

Disponible

Selecciona una librería:

Librería Samer Atenea
Librería Aciertas (Toledo)
Kálamo Books
Librería Perelló (Valencia)
Librería Elías (Asturias)
Donde los libros
Librería Kolima (Madrid)
Librería Proteo (Málaga)

Sobre IBD

Sinopsis

Создание подписей к изображениям с помощью аудио стало сложной, но перспективной задачей в области глубокого обучения. В данной работе предлагается новый подход к решению этой задачи путем объединения конволюционных нейронных сетей (CNN) для извлечения признаков изображения и рекуррентных нейронных сетей (RNN) для последовательного анализа аудио. В частности, мы используем предварительно обученные CNN, такие как VGG, для извлечения визуальных признаков из изображений и используем представления спектрограмм в сочетании с RNN, такими как LSTM или GRU, для обработки аудиовходов. Предлагаемая нами модель основывается не только на визуальном содержании изображений, но и на сопутствующих аудиосигналах. Мы оцениваем производительность нашей модели на эталонных наборах данных и демонстрируем ее эффективность в генерации связных и контекстуально релевантных подписей к изображениям с соответствующими аудиовходами. Кроме того, мы проводим анализ вклада каждой модальности в общую производительность создания титров. Наши результаты показывают, что объединение визуальной и слуховой модальностей значительно улучшает качество создания титров по сравнению с изолированным использованием одной из модальностей.

Подпись к изображению

Selecciona una librería:

Artículos relacionados