Skip to content
Scan a barcode
Scan
Paperback Didascalia immagine [Italian] Book

ISBN: 6207661036

ISBN13: 9786207661039

Didascalia immagine [Italian]

La didascalia delle immagini con l'audio emersa come un compito impegnativo ma promettente nel campo del deep learning. Il presente lavoro propone un approccio innovativo per affrontare questo compito, integrando reti neurali convoluzionali (CNN) per l'estrazione delle caratteristiche delle immagini e reti neurali ricorrenti (RNN) per l'analisi audio sequenziale. In particolare, utilizziamo CNN pre-addestrate come VGG per estrarre le caratteristiche visive dalle immagini e impieghiamo rappresentazioni dello spettrogramma accoppiate con RNN come LSTM o GRU per elaborare gli input audio. Il modello proposto si basa non solo sul contenuto visivo, ma anche sugli spunti audio che lo accompagnano. Valutiamo le prestazioni del nostro modello su set di dati di riferimento e dimostriamo la sua efficacia nel generare didascalie coerenti e contestualmente rilevanti per le immagini con gli input audio corrispondenti. Inoltre, abbiamo condotto studi di tablatura per analizzare il contributo di ciascuna modalit alle prestazioni complessive delle didascalie. I nostri risultati mostrano che la fusione delle modalit visive e uditive migliora significativamente la qualit delle didascalie rispetto all'utilizzo di una delle due modalit in modo isolato.

Recommended

Format: Paperback

Condition: New

$46.84
Save $0.16!
List Price $47.00
50 Available
Ships within 2-3 days

Related Subjects

Business Business & Investing

Customer Reviews

0 rating
Copyright © 2026 Thriftbooks.com Terms of Use | Privacy Policy | Do Not Sell/Share My Personal Information | Cookie Policy | Cookie Preferences | Accessibility Statement
ThriftBooks® and the ThriftBooks® logo are registered trademarks of Thrift Books Global, LLC
GoDaddy Verified and Secured