L'automazione della didascalia, cio la creazione della descrizione in lingua di un'immagine utilizzando qualsiasi elaborazione in linguaggio naturale, un compito difficile. Richiede una buona presa sia nell'elaborazione delle immagini che nell'elaborazione del linguaggio naturale. In questo libro vengono discusse le diverse tecniche disponibili per modellare la didascalia dell'immagine. Il progresso della tecnologia in termini di riconoscimento degli oggetti e di apprendimento automatico ha migliorato molto le prestazioni del modello per il sottotitolaggio delle immagini negli ultimi anni. Oltre a ci cercheremo di avvicinarci alle diverse tecniche e agli algoritmi per costruire questo modello. Alla fine, la valutazione del modello gioca un ruolo importante che sar utile per considerare quale algoritmo si adatta meglio allo scenario. Esistono tecniche che possono essere utilizzate per valutare le prestazioni come la matrice di confusione, f1-score, ma in questo caso i dati sono basati sul linguaggio naturale, quindi basati su un certo tipo di tecnologia speciale che pu essere utilizzata come Microsoft COCO e Flickr30K.
ThriftBooks sells millions of used books at the lowest
everyday prices. We personally assess every book's quality and offer rare, out-of-print treasures. We
deliver the joy of reading in recyclable packaging with free standard shipping on US orders over $15.
ThriftBooks.com. Read more. Spend less.