Analizzare Foto su Telegram con AI Vision

Vision permette al bot Telegram @DoublegramAIBot di vedere le immagini che invii — non solo di leggere le tue parole al riguardo. Nella tua chat privata con il bot, invia una foto, aggiungi una domanda nella didascalia, e il bot analizza l'immagine e risponde a testo.

Questo è diverso dal generare una nuova immagine (vedi Generare Immagini su Telegram dal Testo). Qui hai già una foto e vuoi che l'IA la capisca su Telegram.

Come analizzare un'immagine

Due modi semplici:

Invia una foto con didascalia

Apri @DoublegramAIBot.
Tocca l'icona dell'allegato e invia una foto (o uno screenshot salvato come foto).
Nel campo della didascalia, scrivi la tua domanda — per esempio: Descrivi cosa vedi o Di che marca è questo logo?
Invia. Il bot elabora l'immagine e risponde a testo.

Rispondi a una foto esistente

Se una foto è già nella chat, rispondi a quel messaggio con la tua domanda. Il bot capisce che stai facendo una domanda sull'immagine nel messaggio a cui hai risposto.

Provalo: Invia uno screenshot di una pagina web con la didascalia: Riassumi i punti principali mostrati in questo screenshot.

Usa un modello di testo Gemini

Per l'analisi completa delle immagini, il tuo modello di testo deve essere un modello Google Gemini. Gemini riceve i dati effettivi dell'immagine e può veramente vedere cosa hai inviato.

Per cambiare:

Invia /model.
Tocca Modello di Testo → Google Gemini.
Scegli un modello Gemini (per esempio Gemini 2.5 Flash per velocità, o Gemini 2.5 Pro per domande più difficili).

Se invii una foto mentre usi un modello di testo non Gemini, il bot non può elaborare l'immagine correttamente. Usa sempre Gemini per i compiti di Vision.

Suggerimento: Gemini 2.5 Flash è il modello predefinito per i nuovi utenti — puoi analizzare immagini fin da subito senza cambiare nulla.

Cosa puoi chiedere

Vision funziona per molti compiti quotidiani:

Descrivere una scena — Cosa sta succedendo in questa foto?
Leggere il testo (OCR) — Trascrivi tutto il testo in questa immagine. Utile per foto di documenti, cartelli o screenshot.
Identificare oggetti — Che prodotto è questo? o Che animale c'è nella foto?
Analizzare screenshot — Spiega questo messaggio di errore o Cosa mostra questo grafico?
Ottenere dettagli — Quali colori dominano in questa immagine? o C'è una persona che indossa una giacca rossa?
Aiuto con i contenuti — Scrivi un testo alternativo (alt text) per questa immagine per un post social.

Crediti

Analizzare un'immagine costa il normale prezzo del tuo modello più 1 credito extra per l'immagine. Ad esempio, se Gemini 2.5 Flash costa 3 crediti per richiesta, una domanda con foto costa 4 crediti in totale.

Controlla il tuo saldo con /credits prima di inviare molte immagini. I crediti vengono addebitati solo per le risposte andate a buon fine.

Vision vs generazione di immagini

Vision (questa guida) — Invii una foto → il bot la analizza e risponde a testo.
Generazione di immagini — Descrivi qualcosa su Telegram → il bot crea una nuova foto (vedi Generare Immagini su Telegram dal Testo).

Invia una foto per analizzarla. Scrivi genera un'immagine di… per crearne una nuova.

Riferimento rapido

Invia foto + didascalia, oppure rispondi a una foto con la tua domanda
Usa un modello di testo Gemini (/model → Modello di Testo → Google Gemini)
Costo: crediti del modello + 1 credito per l'immagine
Il modello predefinito (Gemini 2.5 Flash) supporta già la Vision