Computational Methods for Integrating Vision and Language

Computational Methods for Integrating Vision and Language

Kenichi Kanatani / Yasuyuki Sugaya

51,76 €
IVA incluido
Disponible
Editorial:
Springer Nature B.V.
Año de edición:
2016
ISBN:
9783031029424
51,76 €
IVA incluido
Disponible

Selecciona una librería:

  • Librería Samer Atenea
  • Librería Aciertas (Toledo)
  • Kálamo Books
  • Librería Perelló (Valencia)
  • Librería Elías (Asturias)
  • Donde los libros
  • Librería Kolima (Madrid)
  • Librería Proteo (Málaga)

Modeling data from visual and linguistic modalities together creates opportunities for better understanding of both, and supports many useful applications. Examples of dual visual-linguistic data includes images with keywords, video with narrative, and figures in documents. We consider two key task-driven themes: translating from one modality to another (e.g., inferring annotations for images) and understanding the data using all modalities, where one modality can help disambiguate information in another. The multiple modalities can either be essentially semantically redundant (e.g., keywords provided by a person looking at the image), or largely complementary (e.g., meta data such as the camera used). Redundancy and complementarity are two endpoints of a scale, and we observe that good performance on translation requires some redundancy, and that joint inference is most useful where some information is complementary. Computational methods discussed are broadly organized into ones forsimple keywords, ones going beyond keywords toward natural language, and ones considering sequential aspects of natural language. Methods for keywords are further organized based on localization of semantics, going from words about the scene taken as whole, to words that apply to specific parts of the scene, to relationships between parts. Methods going beyond keywords are organized by the linguistic roles that are learned, exploited, or generated. These include proper nouns, adjectives, spatial and comparative prepositions, and verbs. More recent developments in dealing with sequential structure include automated captioning of scenes and video, alignment of video and text, and automated answering of questions about scenes depicted in images.

Artículos relacionados

  • Apostila – Introdução Às Planilhas Eletrônicas
    Daiani Teodoro De Melo Ribeiro - Daniel Teodoro De Melo - Rogério Adriano De Sousa
    Apostila para usuários que desejam iniciar o trabalho com planilhas eletrônicas. Serão tratados os conceitos iniciais relativos à manipulação de planilhas, operações aritméticas, funções matemáticas, funções lógicas, gráficos e a configuração do trabalho para impressão.Após cada conceito apresentado serão propostos exercícios de fixação para que os conceitos possam ser assimila...
    Disponible

    7,80 €

  • Lgpd Ninja - 2a Edição
    Sérgio Pohlmann
    A LGPD veio para ficar e já está valendo e, para não incorrer na desobediência da Lei e não ser multado, as empresas correm para implantar os procedimentos previstos no dispositivo legal. Desde 2018, muitas coisas já mudaram e avançaram no que se refere à Legislação, à implantação e nos procedimentos das empresas e, para acompanhar essa evolução e as empresas manterem-se atuali...
    Disponible

    25,48 €

  • AI in Mind Mapping
    Dr. Salwa Elmeawad
    Welcome to 'AI in Mind Mapping: Revolutionizing Thought Organization,' a comprehensive exploration of the synergy between artificial intelligence (AI) and mind mapping. This book is designed to bridge the gap between the rich, intuitive process of mind mapping and the powerful, analytical capabilities of AI. It serves as both a guide and an inspiration for harnessing these tool...
    Disponible

    27,64 €

  • Guia Prático – Implementando Os 10 Passos Do Owasp
    Ricardo Constantino
    Neste livro essencial e acessível,Guia Prático - Implementando os 10 Passos de OWASP , o Especialista em Segurança da Informação, Ricardo Constantino, oferece uma jornada fascinante e instrutiva pelo universo da segurança de aplicativos web. A obra é um compêndio valioso, apresentando um enfoque prático e detalhado sobre as estratégias necessárias para fortificar aplicativos di...
    Disponible

    13,00 €

  • Debugando A Sua Carreira
    Autores Diversos
    Com base neste conhecimento, será possível refatorar algumas atitudes do seu dia a dia que, por mais que sejam cheias de boas intenções, podem ter e ...
    Disponible

    19,32 €

  • Windows 11
    Gilberto Carniatto Dos Santos
    A obra apresenta o sistema operacional Windows 11 em procedimentos práticos e objetivos, associando teoria à prática, permitindo que o leitor desenvolva a competência em conhecimentos passo a passo, da mais simples à mais complexas. Atividades que articulam a prática dos conhecimentos de Windows 11 com a BNCC - Base Nacional Comum Curricular. ...
    Disponible

    12,43 €

Otros libros del autor

  • Computational Methods for Integrating Vision and Language
    Kenichi Kanatani / Yasuyuki Sugaya
    Modeling data from visual and linguistic modalities together creates opportunities for better understanding of both, and supports many useful applications. Examples of dual visual-linguistic data includes images with keywords, video with narrative, and figures in documents. We consider two key task-driven themes: translating from one modality to another (e.g., inferring annotat...
    Disponible

    78,08 €