Tag: intelligenza artificiale

Hardware, Intelligenza artificiale, Smartphone, Tech, Technology

Ai Pin: l’alternativa allo Smartphone

Per mesi, una strana visione ha incuriosito un poliziotto di San Francisco, regolarmente schierato fuori dagli uffici nel centro della città della startup Humane. Da quella porta sono emersi dipendenti con un piccolo dispositivo quadrato fissato al petto, simile alla telecamera indossabile, più ingombrante, fornita dal dipartimento. “Mi chiedo cosa siano quei dispositivi”, ha detto l’ufficiale quando WIRED ha visitato l’azienda la scorsa settimana.

La rivelazione del gadget di Humane

Oggi, la curiosità sul gadget di Humane è finita. L’azienda sta parlando del suo dispositivo high-tech progettato per essere fissato a una camicia o a una blusa, una soluzione che Humane spera possa diventare accettata tra le persone che non sono agenti giurati, come indossare auricolari wireless o smartwatch.

Le caratteristiche di Ai Pin

Il dispositivo di Humane, chiamato Ai Pin, può scattare foto e inviare messaggi, utilizza un raggio laser per proiettare un’interfaccia visiva sulla mano di una persona e include un assistente virtuale che può essere altrettanto avanzato quanto ChatGPT. Essendo sempre pronto a cercare nel web e comunicare, si suppone che riduca la dipendenza dagli smartphone.

Disponibilità sul mercato e prezzi

Ai Pin sarà in vendita negli Stati Uniti a partire dal 16 novembre, con prezzi a partire da $699, più $24 al mese per chiamate, messaggi e dati illimitati tramite T-Mobile. Humane ha svelato l’aspetto del dispositivo e le sue funzioni di base, tra cui la ricerca web e l’identificazione degli oggetti, alla conferenza TED e in una sfilata di moda parigina all’inizio di quest’anno. Oltre a annunciare prezzi e disponibilità oggi, l’azienda ha rilasciato nuovi dettagli sul software del Pin e su come esattamente un laser all’interno del dispositivo trasforma la mano di una persona in uno schermo. Le spedizioni inizieranno all’inizio del 2024.

Il contesto dei dispositivi indossabili

Il Pin è uno dei primi di molti dispositivi indossabili previsti per essere lanciati nei prossimi mesi e anni, costruiti attorno a servizi di intelligenza artificiale simili a quelli utilizzati attualmente da oltre 100 milioni di persone ogni settimana. Il famoso designer di Apple, Jony Ive, sarebbe tra i concorrenti.

Se uno di essi può diventare socialmente accettabile o resistere all’analisi della moda è una domanda cruciale. I membri di un gruppo Discord creato da Humane per i suoi fan non vedono l’ora di acquistare i loro Pin. Tuttavia, le persone consultate da WIRED che hanno lavorato su hardware indossabile di tendenza, compresi occhiali di realtà aumentata, considerano il Pin più un nuovo giocattolo per gli appassionati di gadget che un dispositivo destinato a stabilire una nuova norma per la tecnologia personale.

La visione di Humane

È ancora troppo presto per dire se la speranza di Humane che il Pin possa aiutare le persone a vivere più nel momento presente si avvererà, o se fornirà semplicemente un nuovo modo per essere ossessionati in modo non salutare dalla tecnologia.

La CEO di Humane, Bethany Bongiorno, è fiduciosa nell’appeal di massa del Pin, definendolo il primo computer contestuale al mondo. “L’IA è diventata qualcosa di cui tutti sono curiosi e vogliono davvero sapere come cambierà la loro vita”, afferma. “Offriamo la prima opportunità di portarla con te ovunque. Sta davvero toccando persone di ogni background, ogni gruppo di età, globalmente, in base a quello che stiamo percependo e vedendo nei feedback.”

Quando Bongiorno e suo marito, Imran Chaudhri, hanno fondato Humane nel 2018 dopo lunghi periodi di lavoro nella progettazione hardware e nell’ingegneria del software presso Apple, hanno imposto rigorosi parametri per il loro prodotto. Doveva essere un dispositivo autonomo collegato direttamente alla rete cellulare, trasparente quando stava registrando e non sempre in ascolto di parole come “Hey Siri” o “OK Google”, come fanno gli smart speaker e alcuni telefoni. E l’intero pacchetto doveva essere conveniente. “Questo ha davvero impostato il tono per dove siamo oggi”, dice Bongiorno.

La visione di Humane sui dispositivi indossabili

I fondatori di Humane vedono i dispositivi indossabili precedenti, come gli occhiali intelligenti e gli headset AR, come ostacoli alla connessione umana. Il Pin è pensato per essere meno invasivo, sebbene altrettanto capace, e qualcosa che le persone possono indossare comodamente tutto il giorno senza rovinare la pettinatura. “Cerchiamo di avere una potente elaborazione con noi in ogni momento, ed è davvero di questo che si tratta”, dice Chaudhri, presidente e presidente della società. “Vogliamo avere accesso a più conoscenza, più informazioni. Vogliamo solo che sia in un modo che ci permetta di rimanere presenti.”

Successo finanziario e investitori di Humane

La startup ha raccolto $230 milioni di finanziamenti, inclusi $100 milioni annunciati a marzo, che la valuterebbero a $850 milioni circa. Gli investitori di Humane includono il CEO di OpenAI Sam Altman, che detiene la più grande quota esterna, circa il 15%; il CEO di Salesforce Marc Benioff; Microsoft; e i bracci di venture di LG, Volvo e Qualcomm.

Dopo aver ordinato un Pin, gli acquirenti accedono a un sito web, Humane.center, per sincronizzare i loro contatti e iscriversi a servizi extra come la musica. Utilizzano la fotocamera del Pin per scannerizzare un codice fornito con il dispositivo per associarlo a quell’account online, dove registrazioni, foto e cronologie di chiamate e messaggi sono accessibili. I dati degli utenti non verranno utilizzati per addestrare sistemi di intelligenza artificiale, assicura Humane.

Mark Lucovsky, ex dirigente software responsabile dei progetti di realtà aumentata presso Google e Meta, dà merito a Humane per non aver creato un altro paio di occhiali intelligenti. Tuttavia, si preoccupa che trovare un design per il Pin che un vasto pubblico trovi indossabile o alla moda richiederà molto tempo.

Considerazioni etiche e futura evoluzione del Pin

L’enfasi di Humane sulla privacy potrebbe anche attenuare l’interesse per il Pin, spegnendo funzionalità potenzialmente rivoluzionarie, sostiene Lucovsky. Se la fotocamera del dispositivo analizzasse sempre attivamente l’ambiente di una persona, potrebbe aiutare le persone a trovare le chiavi smarrite o ricordare loro, mentre sono al negozio, se ci sono ancora uova nel frigorifero a casa. “Abbiamo già a disposizione i chatbot tramite i telefoni”, dice. “Qual è il valore convincente e inaspettato che ottieni dal tuo Pin? Non credo di averlo ancora visto. Ma sono entusiasta di vedere come si evolverà.”

Bongiorno e Chaudhri affermano di essere tanto tecnorealisti quanto tecnottimisti. Non si aspettano che il Pin sostituisca completamente gli smartphone e riconoscono che il Pin potrebbe sollevare nuove questioni etiche. “Parliamo non solo dei potenziali vantaggi incredibili, ma anche di cosa può andare storto”, dice Chaudhri, rifiutandosi di fornire una suddivisione del tempo trascorso usando il suo telefono rispetto al Pin.

I fondatori di Humane dicono di non aver provato altri dispositivi basati sull’IA, ma ritengono che sia un segno positivo che non sono soli in questa nuova frontiera. Hanno parlato di sviluppare integrazioni per il Pin per le case con LG e per le auto con Volvo. Per ora, chiunque voglia provare la visione del futuro di Humane dovrà accontentarsi di assomigliare un po’ di più a un poliziotto da film americano.

    Contattaci subito

    LEGGI ANCHE:

    Intelligenza artificiale

    AI che ti cerca lavoro mentre dormi

    Ti sei mai chiesto come l’Intelligenza Artificiale possa influire sul mondo della ricerca del lavoro?

    Già in passato abbiamo parlato di ChatGPT e Intelligenza Artificiale, se vuoi saperne di più clicca qui

    Tornando alla nostra storia: Julian Joseph, un ingegnere software colpito dai grossi tagli nel settore tecnologico, ha sfruttato un servizio per automatizzare la sua ricerca di lavoro.
    Andiamo ad esplorare insieme questo articolo steso originariamente da Wired da noi tradotto.

    LazyApply: Automatizzare le Candidature

    A luglio, Julian Joseph è stato licenziato per la seconda volta in due anni a causa dei tagli nell’industria tecnologica. Temendo un lungo periodo di ricerca del lavoro, ha scoperto LazyApply, un servizio AI chiamato Job GPT che promette di candidarsi automaticamente a migliaia di lavori con un clic.

    Reazioni Divergenti: Cercatori di Lavoro e Recruiter

    L’automatizzazione delle candidature tramite AI è attraente per molti cercatori di lavoro, stanchi di reinserire le stesse informazioni nei sistemi di tracciamento dei candidati. Tuttavia, i reclutatori sono divisi sull’uso di bot. Alcuni ritengono che dimostri mancanza di serietà, mentre altri sono più aperti, purché il candidato sia valido. LazyApply ha concorrenza, con servizi come Sonara e Massive che offrono opzioni simili. Alcune aziende, come NeedleFinder Recruiting, non sono preoccupate dal modo in cui ricevono i curriculum, a patto che siano validi.

    Mentre alcuni sostengono che la quantità di candidature è cruciale, altri, come Dawson di NeedleFinder Recruiting, ritengono che la qualità sia più importante, specialmente per i professionisti affermati. Molti di questi servizi offrono anche lettere di presentazione generate dall’IA e assistenza nelle dimissioni. Tuttavia, alcuni sostengono che le referenze rimangono il modo più efficace per trovare lavoro, nonostante l’automatizzazione crescente nel settore della ricerca del lavoro.

    Competizione tra Servizi e Prospettive dei Cercatori di Lavoro

    LazyApply ha concorrenza, con servizi come Sonara e Massive che offrono opzioni simili.

    Il fondatore di Sonara, Victor Schwartz, ha sviluppato il suo servizio dopo aver trovato difficoltà nella ricerca di lavoro durante l’ultimo anno di studi. Schwartz ritiene che, sebbene il networking sia efficace, molti evitano questa pratica “spaventosa”. Sonara, attualmente con 5.000 utenti, offre un servizio AI che adatta automaticamente i curriculum alle descrizioni dei lavori.

    Sfide e Segreti della Tecnologia nelle Candidature

    I servizi di auto-candidatura solitamente non rivelano l’uso di bot o AI, ma alcuni segnali, come candidature istantanee o candidati non consapevoli delle posizioni applicate, possono far sospettare i reclutatori. Tuttavia, l’invio massiccio di candidature potrebbe portare a essere identificati come spam, creando problemi per i cercatori di lavoro. Alcuni ritengono che l’IA potrebbe essere più efficace se focalizzata su ruoli specifici, mentre altri, come Massive, cercano di migliorare la corrispondenza tra candidati e aziende aggregando informazioni sulla cultura aziendale da varie fonti.

    Consigli Esperti e Bilanciamento nell’Uso delle Tecnologie

    Sebbene l’IA possa semplificare il processo di candidatura, esperti come Gabrielle Judge consigliano di utilizzarla come parte di una strategia più ampia, che includa il networking e la ricerca manuale. Mentre LazyApply ha portato a successo per Julian Joseph, è importante bilanciare l’uso di strumenti automatizzati con approcci più tradizionali per massimizzare le opportunità di lavoro.

    Julian Joseph apprezza l’utilità di LazyApply nel gestire le noiose procedure di candidatura, consentendogli di concentrarsi sul networking e altre strategie senza preoccuparsi di perdere opportunità di lavoro. Tuttavia, non tutte le interviste ottenute tramite lo strumento erano perfette corrispondenze per i ruoli “DevOps” che cercava su Salesforce Cloud. A volte, LazyApply si candidava per ruoli di vendita non pertinenti. Nonostante ciò, Joseph ha rilevato che lo strumento gli ha permesso di scoprire lavori migliori di quanto pubblicizzato, come un’opportunità remota che ha appreso durante l’intervista.

    Joseph ritiene che, nonostante le non corrispondenze perfette, utilizzare lo strumento migliora le sue capacità di intervista e approfondisce la comprensione di ciò che desidera. Ha ricevuto un’offerta per un lavoro a contratto attraverso LazyApply e ha ottenuto colloqui con Apple e la Casa Bianca. Le ultime due opportunità sono emerse grazie alle sue connessioni personali, dimostrando che, nonostante l’automazione, il networking umano rimane un elemento cruciale nella ricerca di lavoro.

    E tu che ne pensi? Faccelo sapere nei commenti

      Contattaci subito

      LEGGI ANCHE:

      Intelligenza artificiale

      Photoshop fa miracoli con l’intelligenza artificiale

      Utilizzando Photoshop insieme alla potenza dell’Intelligenza Artificiale, è possibile apportare rapidamente modifiche a un’immagine, inclusa l’aggiunta non solo di elementi singoli, ma anche di intere regioni.

      L’Intelligenza Artificiale è diventata un campo di grande interesse attuale, attirando l’attenzione di aziende provenienti da settori diversi. Impiegata online per gestire automaticamente le richieste dei clienti, si sta persino discutendo il suo utilizzo per la guida dei futuri droni da combattimento.

      Tuttavia, utilizzare questa tecnologia per l’elaborazione grafica non è una sfida semplice. Non sorprende, quindi, che Adobe, un leader nell’ambito dell’elaborazione grafica, sia stata tra le prime, se non la prima, a presentare soluzioni basate sull’IA in grado di generare immagini di qualità professionale. Recentemente, la software house americana ha annunciato l’integrazione della funzione Riempimento Generativo, basata sull’IA, in una versione dedicata di Photoshop (al momento in fase beta).

      Cos’è

      Leggendo queste informazioni, è naturale chiedersi cosa sia possibile fare con questa nuova opzione. Anche se siamo ancora nelle fasi iniziali, il Riempimento Generativo offre diverse possibilità. Con questa funzionalità, è possibile espandere una fotografia, rimuovere oggetti o aggiungerne di nuovi.

      Per esempio, se desideri creare un ampio panorama marino, non è più necessario combinare diverse foto. Puoi semplicemente ingrandire la dimensione di un fotogramma utilizzando il comando “Dimensione quadro” e dire a Photoshop di riempire automaticamente le aree vuote.

      intelligenza artificiale immagine

      Un aspetto molto utile è la capacità di inserire oggetti che vengono creati in base al contesto, tenendo conto della dimensione, del colore e persino dell’ombreggiatura. Se desideri aggiungere una barca alla tua scena, ad esempio, puoi semplicemente digitare “boat” (nella versione Beta, le parole chiave devono essere in inglese, anche se in futuro sarà possibile utilizzare l’italiano) e vedrai apparire un’immagine realistica di una barca che galleggia tra le onde. È importante sottolineare che il risultato è estremamente realistico e non si basa su una porzione dell’immagine originale.

      Questa funzione può anche essere utilizzata per rimuovere rapidamente oggetti, anche di grandi dimensioni.

      Riempimento generativo

      La funzione di “Riempimento Generativo” di Photoshop si basa sull’Intelligenza Artificiale (IA) e in particolare su una tecnica chiamata “deep learning” o apprendimento profondo. In sostanza, utilizza una rete neurale artificiale, addestrata su un vasto dataset di immagini, per generare contenuti visivi che si integrano in modo coerente con l’immagine originale.

      Ecco come funziona in modo più dettagliato:

      1. Addestramento della rete neurale: Prima di essere utilizzata, la rete neurale viene addestrata su un ampio insieme di immagini che contengono oggetti, scenari e contesti diversi. Questo allenamento permette alla rete di imparare a riconoscere le caratteristiche visive e il contesto delle immagini.
      2. Generazione dell’immagine: Quando si utilizza la funzione di Riempimento Generativo in Photoshop, si seleziona un’area dell’immagine che si desidera modificare o espandere. La rete neurale utilizza quindi le informazioni apprese durante l’addestramento per generare nuovi contenuti visivi che si adattano in modo naturale al contesto dell’immagine originale.
      3. Coerenza visiva: L’IA si sforza di produrre risultati che siano coerenti con il resto dell’immagine in termini di stile, colore, ombreggiatura e altro ancora. Ciò contribuisce a rendere il risultato finale il più realistico possibile.
      4. Interazione dell’utente: L’utente può spesso fornire indicazioni alla rete neurale, ad esempio digitando parole chiave come “boat” per aggiungere un oggetto specifico. La rete cerca quindi di generare un oggetto che corrisponda alla descrizione fornita.

      In sintesi, il Riempimento Generativo di Photoshop sfrutta le capacità di un’IA addestrata per generare nuovi contenuti visivi che si integrano in modo coerente e realistico nelle immagini esistenti. Questa tecnologia può essere utilizzata per una varietà di scopi, come l’aggiunta di oggetti, la rimozione di elementi indesiderati o l’espansione di immagini esistenti.

      Firefly

      La funzione di Riempimento Generativo si basa su Firefly, la famiglia di modelli di Intelligenza Artificiale Generativa creati da Adobe, con una prima enfasi sulla creazione di immagini ed effetti di testo. È essenziale ricordare che Firefly è stata sviluppata utilizzando milioni di immagini non coperte da copyright, come quelle disponibili su Adobe Stock. Inoltre, abbiamo la possibilità di integrare il nostro materiale creativo per generare contenuti personalizzati.

      È importante notare che, al fine di preservare l’integrità dell’immagine originale, i nuovi contenuti vengono inseriti su livelli separati che possono essere rimossi con facilità. Prepariamoci a essere sorpresi dalle possibilità che questa funzione offre.

      photoshop
      Desideri rimuovere le due persone dalla foto? Non c’è bisogno di preoccuparsi della precisione; puoi farlo facilmente usando lo Strumento Rimuovi, che si basa anch’esso sull’IA. Basta evidenziare l’area contenente le due persone con il mouse, e vedrai che magicamente spariranno dalla foto.

        Contattaci subito

        Intelligenza artificiale

        Intelligenza Artificiale: nuove funzionalità di ChatGPT

        L’Intelligenza Artificiale è una potente risorsa, ma ottenere da essa i risultati desiderati richiede un approccio accurato nella formulazione delle istruzioni. Ecco dei trucchi per ottenere ciò che desideriamo

        Oggi, grazie all’Intelligenza Artificiale, è possibile svolgere una vasta gamma di attività. Poiché spesso interagiamo con questi strumenti attraverso chatbot, come l’ampiamente noto ChatGPT, possiamo ottenere risultati soddisfacenti anche utilizzando approcci spontanei e formulando il nostro primo messaggio senza alcuna preparazione.

        Questa espressione si riferisce alla dichiarazione, istruzione o domanda che usiamo per avviare una conversazione o per richiedere informazioni o risposte specifiche dal modello. Nel caso di un chatbot, questa può essere qualsiasi frase o interrogativo che inciti una discussione su un argomento particolare, come ad esempio “Puoi spiegarmi la storia del Colosseo?”, “Hai suggerimenti per avviare con successo un’attività?” oppure “Raccontami una battuta divertente.”

        Non solo chiacchiere

        Questi suggerimenti sono fondamentali per iniziare una conversazione con l’Intelligenza Artificiale e stabilire un punto di partenza utile. Tuttavia, se desideriamo ottenere risultati veramente significativi e sfruttare appieno il potenziale dell’IA per scopi professionali, educativi o personali, è essenziale apprendere come comunicare con essa nella sua lingua, ossia generare i prompt più efficaci e appropriati. Questo vale anche nel caso in cui vogliamo ottenere output diversi, come immagini generate da sistemi di generazione grafica.

        La capacità di scrivere il prompt perfetto è un’abilità che può essere quasi considerata un’arte. In effetti, esistono professionisti noti come “prompt engineer” o “ingegneri dei prompt” che hanno una profonda conoscenza dei diversi modelli di Intelligenza Artificiale e sono in grado di aiutare le aziende a risparmiare tempo e risorse creando richieste ottimali per scopi specifici.

        Questi esperti conoscono i dettagli tecnici dei modelli AI, comprendono come influenzare l’output e possono personalizzare le richieste per ottenere risultati desiderati. Questa capacità è particolarmente importante quando si cerca di ottenere risposte complesse o di elevata qualità. Imparare a formulare prompt efficaci è quindi cruciale per sfruttare al meglio le potenzialità dell’Intelligenza Artificiale in vari contesti professionali e creativi.

        Istruzione e contesto

        Assolutamente, per creare prompt efficaci, è fondamentale capire il loro potere nel modellare le risposte generate dall’Intelligenza Artificiale. Il prompt è il principale strumento che determina la qualità e la precisione delle risposte dell’IA. Attraverso il prompt, si condiziona il modello con informazioni o requisiti specifici, delineando il tipo di risposta che l’IA produrrà. Il modo in cui si effettua questo condizionamento può variare in base all’obiettivo.

        Ecco alcune strategie per creare prompt efficaci:

        1. Fornire contesto: Includere informazioni di base nel prompt è essenziale. Ad esempio, se si desidera che l’IA crei una poesia sulla natura, è utile fornire dettagli sulla stagione, sull’ambientazione o sulle emozioni che si vogliono evocare. Questo contesto aiuta l’IA a comprendere meglio il compito e a generare risposte pertinenti.
        2. Istruzioni specifiche: Definire chiaramente l’obiettivo e fornire istruzioni esplicite per il compito è cruciale. Ad esempio, se si vuole che l’IA scriva un articolo sulla sostenibilità, si dovrebbero specificare i punti chiave da trattare e il tono da utilizzare.
        3. Domande dirette: Nell’interrogare l’IA, fare domande dirette può essere efficace. Ad esempio, invece di chiedere “Parlami dell’inquinamento atmosferico”, è possibile scrivere “Fornisci una panoramica dettagliata sull’inquinamento atmosferico, includendo le sue cause principali e gli effetti sulla salute umana.”
        4. Sperimentare: Non esitare a sperimentare con diversi approcci di formulazione del prompt per vedere quale genera la risposta desiderata. Le piccole modifiche possono fare una grande differenza.
        5. Revisione continua: Dopo aver ottenuto una risposta dall’IA, esaminare attentamente se soddisfa le aspettative. Se necessario, è possibile apportare correzioni o riformulare il prompt per ottenere una risposta migliore.

        In generale, l’arte di creare prompt efficaci richiede pratica e comprensione del modello di Intelligenza Artificiale con cui si sta interagendo. Condizionare l’IA in modo adeguato attraverso i prompt è fondamentale per ottenere risultati utili e pertinenti nei vari contesti.

        Oltre a ciò, è necessario fornire istruzioni specifiche per il compito che intendiamo assegnare all’IA. Questo implica la chiara definizione del risultato finale desiderato e la comunicazione di istruzioni dettagliate e inequivocabili. Per esempio, se stiamo chiedendo all’IA di generare un’immagine che raffiguri un tramonto tranquillo sopra una catena montuosa, utilizzando colori vibranti e con un aspetto “da sogno”, è essenziale fornire dettagli così specifici in modo che il prompt sia in grado di guidare l’IA nella giusta direzione. Più le istruzioni sono chiare, specifiche e ricche di dettagli, tanto più elevata sarà la probabilità che l’IA produca il risultato esatto che stiamo cercando di ottenere.

        Porre delle limitazioni

        Un aspetto finale da considerare, di notevole importanza, riguarda l’impiego dei vincoli. In diverse circostanze, i vincoli possono effettivamente potenziare sia la creatività sia la precisione dei risultati generati dall’Intelligenza Artificiale. Per esempio, se desideriamo ottenere una composizione poetica, può rivelarsi vantaggioso specificare una particolare struttura poetica, come un sonetto o un haiku, al fine di ottenere una produzione più focalizzata. Allo stesso modo, se intendiamo richiedere una spiegazione di un teorema matematico, è opportuno indicare se desideriamo un’illustrazione semplificata o un’esplicazione adatta a un pubblico di studenti delle scuole medie.

        Inoltre, i vincoli possono anche abbracciare un aspetto creativo, come quando richiediamo all’IA di creare un’opera d’arte ispirata allo stile di un determinato artista. Capire come interagiscono il condizionamento, il contesto, le istruzioni specifiche per una data attività e i vincoli costituisce la chiave per la scrittura efficace dei prompt.

        Lasciamo che ci aiuti

        L’Intelligenza Artificiale offre non solo strumenti per ottimizzare i prompt esistenti, ma anche per crearli inizialmente in inglese a partire da istruzioni in italiano. Questo approccio permette di sfruttare una vasta base di dati in inglese, dato che i modelli AI sono solitamente più addestrati per questa lingua. Successivamente, sarà l’IA stessa a tradurre il testo in italiano.

        Inoltre, per la grafica, è possibile ricevere assistenza dall’Intelligenza Artificiale e persino creare prompt basati su immagini. L’IA è stata progettata per essere un supporto, quindi possiamo sfruttare questa caratteristica per generare prompt iniziali di alta qualità, che poi possiamo ulteriormente perfezionare per ottenere risultati eccellenti.

        In sintesi, l’IA offre una gamma di strumenti per semplificare il processo di creazione di prompt, consentendoci di accedere a una vasta base di dati, migliorando così la qualità delle interazioni e dei risultati ottenuti.

        Creiamo testi perfetti senza fatica

        intelligenza artificiale promptperfect
        Colleghiamoci al sito di PromptPerfect (https://promptperfect.jina.ai/home), registriamoci e, per iniziare, scegliamo il livello Principiante per l’ottimizzazione automatica dei prompt. Do­po esserci fatti la mano potremo sperimentare con gli altri livelli.
        intelligenza artificiale promptperfect 2
        Clicchiamo su Nuova ottimizzazione per creare il nostro prompt e selezioniamo il modello (ossia la piattaforma di Intelligenza Artificiale) da utilizzare. Tra i vari modelli di testo disponibili, selezioniamo ChatGPT.
        intelligenza artificiale promptperfect 3
        Inseriamo uno spunto originale per il nostro prompt, ossia in questo caso un tema su Dante. Clicchiamo sulla freccia per proseguire. Partiamo con 21 crediti nella versione gratuita ma aumenteranno più useremo PromptPerfect
        intelligenza artificiale promptperfect 4
        Dal nostro spunto di 5 parole PromptPerfect ha generato un prompt di 115 parole in inglese e molto più dettagliato. Possiamo anche visualizzarlo in italiano.
        Viene generato sia un testo dal nostro spunto originale sia uno dal prompt ottimizzato, in inglese. Cliccando sull’ico­na del foglio possiamo copiare ogni parte della pagina. Se­lezioniamo copia l’output dopo l’ottimizzazione
        Apriamo ChatGPT, scriviamo “Traduci in italiano que­ sto testo:” e incolliamo l’output. Avremo il nostro tema in italiano, basato sull’addestramento più completo di ChatGPT, e non ci è servito usare l’inglese.

        Generiamo un prompt da una foto

        Possiamo anche ottenere gratuitamente un prompt per creare un’immagine simile a una che abbiamo già,
        usandola come modello. Rechiamoci all’indirizzo https://replicate.com/collections/image-to-text e selezioniamo il modello da https://replicate.com/methexis-inc. Trasciniamo un’immagine su
        Drop a file or click to select o clicchiamo per caricarla dall’hard disk. Altrimenti clicchiamo su Take a photo with your webcam per scattare una foto. Clicchiamo su Submit per ricavare un prompt in inglese che la descriva. Copiamolo, andiamo all’indirizzo https://replicate.com/stabiIity-ai/stabIe-diffusion
        e incolliamolo nel campo Prompt. Eliminiamo degli elementi se ci sembrano superflui e clicchiamo su Submit per generare la nostra immagine.

          Contattaci subito

          LEGGI ANCHE:

          Applicazioni, Smartphone

          Microsoft Translator: traduttore con intelligenza artificiale

          Microsoft Translator, traduttore sempre a disposizione, con intelligenza artificiale

          La versione dell’app Microsoft Translator è disponibile sia per dispositivi Android che per iOS. Sebbene la versione per Android sia ben realizzata e completamente funzionale, è quella per iOS che ha ricevuto gli aggiornamenti più significativi fino ad ora. Tra le nuove caratteristiche introdotte in questa versione, c’è un miglioramento nella traduzione vocale grazie all’utilizzo dell’Intelligenza Artificiale, che riconosce automaticamente la lingua parlata.

          Nuova funzione molto intelligente

          Questa tecnologia è chiamata LID (identificazione continua del linguaggio) e permette a due persone di conversare in modo naturale e continuo, senza dover selezionare manualmente le lingue di origine e destinazione o toccare il microfono ogni volta che qualcuno parla.

          Microsoft Translator

          Quando entrambe le lingue selezionate supportano il LID, l’icona del microfono si trasforma in una stella per indicare questa funzione. Oltre alla traduzione vocale, l’applicazione supporta anche la traduzione di testi e ha la capacità di tradurre testo presente nelle immagini. Microsoft ha annunciato che presto questa versione dell’applicazione sarà disponibile anche per il sistema operativo Android, inclusi tutti i nuovi miglioramenti e funzionalità.

          Traduzione fra gruppi

          Per facilitare le conversazioni con persone o gruppi che non parlano fluentemente la nostra lingua, Microsoft Translate offre la funzionalità chiamata “conversazione multi-dispositivo”. Per attivarla, è sufficiente toccare l’icona posizionata nell’angolo in alto a destra dell’applicazione. Questa opzione consente di trascrivere il discorso di una singola persona o di tradurre le conversazioni di più utenti all’interno di un gruppo che utilizza dispositivi diversi.

          Microsoft Translator gruppi

          Per iniziare, inseriamo il nostro nome e la lingua che parliamo, quindi concediamo il permesso di accedere al Bluetooth poiché l’applicazione utilizza questa tecnologia per trasmettere le conversazioni. Infine, selezioniamo “Avvia” per avviare una nuova conversazione o per accedere a una conversazione già attiva. In entrambi i casi, ci verrà fornito un codice di sicurezza composto da cinque lettere per unirci al gruppo di conversazione.

          Se siamo noi ad avviare la conversazione, possiamo condividere il codice mostrando il codice QR ad altre persone, così da consentire loro di unirsi al gruppo di conversazione.

          Disponibile per Ios e Android.

            Contattaci subito

            LEGGI ANCHE:

            Intelligenza artificiale

            L’Intelligenza Artificiale

            Quando ci si riferisce all’Intelligenza Artificiale, si evoca immediatamente l’immagine di tecnologie all’avanguardia, di robot in grado di comprendere e prendere decisioni autonome, e di un mondo futuristico in cui uomini e macchine coesistono. Tuttavia, l’Intelligenza Artificiale e il suo impiego sono molto più concreti di quanto si possa immaginare e trovano applicazione effettiva in diversi settori della vita quotidiana. È importante notare che tali applicazioni risultano meno invasive di quanto spesso si possa pensare o di quanto venga rappresentato nei film di fantascienza, i quali traggono ispirazione dall’Intelligenza Artificiale come tema centrale per numerose serie, alcune delle quali di successo.Ma cos’è realmente l’Intelligenza Artificiale e come si è sviluppata?

            Dal punto di vista tecnico, l’Intelligenza Artificiale rappresenta un campo dell’informatica che si occupa della programmazione e del design di sistemi hardware e software, i quali conferiscono alle macchine determinate caratteristiche considerate tipicamente umane, come ad esempio la percezione visiva, spazio-temporale e decisionale. In altre parole, l’Intelligenza Artificiale non si limita solo all’aspetto dell’intelligenza intesa come capacità di calcolo o conoscenza di dati astratti, ma si estende anche a tutte quelle diverse forme di intelligenza riconosciute dalla teoria di Gardner. Queste forme comprendono l’intelligenza spaziale, sociale, cinestetica e introspettiva. L’obiettivo di un sistema intelligente è quindi quello di cercare di riprodurre una o più di queste diverse forme di intelligenza, che, sebbene comunemente associate all’essere umano, possono effettivamente essere replicabili da specifiche macchine.

            Quando nasce l’Intelligenza Artificiale?

            Secondo la definizione odierna, l’Intelligenza Artificiale ha avuto origine con l’avvento dei computer nel 1956. In quell’anno si tenne un convegno negli Stati Uniti, al quale parteciparono importanti esperti del campo che successivamente sarebbe stato denominato Intelligenza Artificiale, ma che allora era noto come Sistema Intelligente. Durante questo entusiasmante evento, furono presentati programmi in grado di eseguire ragionamenti logici, in particolare nell’ambito della matematica. Il programma Logic Theorist, sviluppato dai ricercatori informatici Allen Newell e Herbert Simon, dimostrò la capacità di dedurre teoremi matematici a partire da determinate informazioni.

            Come si può immaginare, gli anni successivi alla nascita dell’Intelligenza Artificiale furono un periodo di fervore intellettuale ed esplorativo. Università e aziende informatiche, tra cui spicca IBM, si dedicarono alla ricerca e allo sviluppo di nuovi programmi e software capaci di pensare e agire come esseri umani, almeno in determinati campi e settori. Emergono programmi sempre più complessi nel dimostrare teoremi, e soprattutto, viene creato Lisp, il primo linguaggio di programmazione che ha fornito la base per i software di Intelligenza Artificiale per oltre trent’anni. Gli anni che seguirono sono stati un periodo di grande progresso e scoperte nel campo dell’Intelligenza Artificiale.

            La nuova era dell’Intelligenza Artificiale si apre con l’utilizzo di un algoritmo innovativo, concepito già alla fine degli anni Sessanta, ma che non ha trovato piena applicazione a causa delle limitazioni dei primi programmi di Intelligenza Artificiale nel campo dell’apprendimento. Parliamo dell’algoritmo che consente l’apprendimento per reti neurali, il quale è stato sperimentato sia in ambito informatico che psicologico. Grazie a questa duplice applicazione, gli sviluppatori di Sistemi Intelligenti hanno scoperto un’ampia gamma di possibilità. In particolare, il primo vero successo dell’Intelligenza Artificiale è stato l’incontro tra Deep Blue, una macchina sviluppata da IBM, e il campione di scacchi in carica, Garry Kasparov. Sebbene i primi scontri siano stati vinti da Kasparov, i continui miglioramenti apportati al sistema di apprendimento di Deep Blue hanno permesso alla macchina di ottenere la vittoria nelle partite successive. Questa vittoria, come confermato dallo stesso campione di scacchi, è stata attribuita al fatto che la macchina aveva raggiunto un livello di creatività così elevato da superare le conoscenze stesse del giocatore.

            Le basi dell’intelligenza artificiale

            Alla base dei problemi con lo sviluppo di sistemi e programmi di Intelligenza Artificiale ci sono tre cose fondamentali che riguardano il modo in cui gli esseri umani si comportano. Prima di tutto, c’è bisogno di una conoscenza che non sia noiosa e sterile, ma che abbia un tocco di vita. Poi, c’è bisogno di avere una coscienza che permetta di prendere decisioni non solo basandosi sulla logica, ma anche sull’abilità di risolvere problemi in modo diverso a seconda del contesto in cui ci si trova.

            Grazie all’uso delle reti neurali e di algoritmi che sanno ragionare come noi umani in diverse situazioni, i sistemi intelligenti stanno migliorando sempre di più le loro abilità comportamentali. Per farlo, la ricerca si è concentrata non solo nello sviluppo di nuovi algoritmi, ma soprattutto nell’aumentare il numero di algoritmi che possono imitare i comportamenti diversi in base agli stimoli ambientali. Questi algoritmi complessi, inseriti nei sistemi intelligenti, sono in grado di “prendere decisioni”, cioè fare scelte in base al contesto in cui si trovano. Ad esempio, quando gli algoritmi sono collegati ai veicoli autonomi, l’auto può decidere, in caso di pericolo, se sterzare o frenare a seconda della situazione. Dipende dalle informazioni che arrivano dai sensori e calcolano quale opzione garantisca una maggiore sicurezza per il conducente e i passeggeri.

            Le decisioni prese dai veicoli autonomi e dagli altri sistemi di Intelligenza Artificiale si basano su algoritmi specifici che definiscono una conoscenza di base e una conoscenza più ampia che viene creata tramite l’esperienza. Per migliorare sempre di più gli algoritmi, è stato sviluppato un settore dedicato chiamato “rappresentazione della conoscenza”. Questo settore studia come ragioniamo come esseri umani e, soprattutto, come rendere questa conoscenza comprensibile alle macchine tramite un linguaggio e comandi sempre più precisi e dettagliati. Quando si parla di conoscenza umana e di trasferimento di questa conoscenza alle macchine, non si tratta solo di nozioni accademiche. Si tratta piuttosto di esperienza e della capacità di comprendere nuove informazioni attraverso quelle che abbiamo già nel nostro sistema. Queste informazioni vengono fornite alle macchine attraverso diverse modalità, le più importanti delle quali si basano sulla Teoria dei Linguaggi Formali e sulla Teoria delle Decisioni.

            Nel caso della Teoria dei Linguaggi Formali, utilizziamo diversi approcci (i principali sono l’approccio generativo, riconoscitivo, denotazionale, algebrico e trasformazionale) che si basano sulle teorie delle Stringhe e sul loro utilizzo. Le Stringhe rappresentano veri e propri linguaggi formali, ma le loro proprietà variano a seconda dell’approccio che si utilizza.

            L’apprendimento automatico

            Un grande passo avanti nell’Intelligenza Artificiale è stato compiuto quando sono stati creati algoritmi specifici che permettono alle macchine di migliorare il loro comportamento (cioè la capacità di agire e prendere decisioni) attraverso l’esperienza, proprio come fanno gli esseri umani. È fondamentale sviluppare algoritmi che possano imparare dai propri errori per creare sistemi intelligenti che operino in contesti imprevedibili dai programmatori. Grazie all’apprendimento automatico (machine learning), una macchina può imparare a compiere azioni anche se non sono state programmate in anticipo.

            Per i non esperti, l’apprendimento automatico è probabilmente la parte più “romantica” dell’Intelligenza Artificiale, che ha ispirato diversi registi per i loro film famosi che raccontano come le macchine e i robot migliorino nel tempo grazie all’esperienza. Oltre all’aspetto scenico e affascinante, l’apprendimento automatico è il frutto di una profonda ricerca teorica e pratica, basata sulla teoria computazionale dell’apprendimento e sul riconoscimento dei pattern. L’apprendimento automatico è complesso e può essere suddiviso in tre modalità a seconda delle richieste di apprendimento rivolte alla macchina: apprendimento supervisionato, apprendimento non supervisionato e apprendimento per rinforzo. Le differenze tra queste modalità risiedono principalmente nel contesto in cui la macchina deve imparare le regole generali e specifiche che portano alla conoscenza. Nell’apprendimento supervisionato, ad esempio, vengono forniti alla macchina esempi di obiettivi da raggiungere, mostrando le relazioni tra input, output e risultato. La macchina deve quindi estrarre una regola generale dai dati forniti, in modo che possa scegliere l’output corretto ogni volta che viene stimolata da un determinato input per raggiungere l’obiettivo.

            Il futuro dell’Intelligenza Artificiale

            Se fino a pochi anni fa il principale problema di tutti gli scienziati coinvolti nella ricerca relativa all’Intelligenza Artificiale era quello di poter dimostrare la realistica possibilità di utilizzare sistemi intelligenti per usi comuni, oggi che questo obiettivo è ampiamente raggiunto ci si chiede spesso quale possa essere il futuro dell’Intelligenza Artificiale. Sicuramente molta strada deve essere ancora fatta, sopratutto in determinati settori, ma la consapevolezza che l’Intelligenza Artificiale oggi rappresenta una realtà e non più un’ipotesi, i dubbi sono soprattutto relativi alle diverse possibilità di utilizzo dei sistemi intelligenti e al loro impatto sul tessuto sociale ed economico.

            E se da un lato l’entusiasmo per l’evoluzione tecnologica è sicuramente molto evidente in diversi settori, dall’altro la paura che a breve le macchine potrebbero sostituire del tutto l’uomo in molti luoghi di lavoro si è insinuata in maniera sempre più insistente nelle menti di molti. L’evoluzione tecnologica già in passato ha portato a sostituire la mano d’opera umana con macchine e computer che, in maniera più rapida e soprattutto più economica, sono stati utilizzati in diversi settori. Con l’uso massivo dell’Intelligenza Artificiale sarà possibile perdere ulteriori posti di lavoro ma è anche vero che si apriranno sempre più strade per la realizzazione di nuove tipologie di figure professionali. Ma il contrasto tra uomo e macchina è un settore molto più ampio che non è solo relativo all’evoluzione dell’Intelligenza Artificiale e dei sistemi intelligenti, ma anche e soprattutto relativo alla morale e all’etica lavorativa e al corretto utilizzo delle macchine nel rispetto dell’uomo. Probabilmente la direzione che si prenderà non è ancora ben delineata, ma potrà portare a una nuova rivoluzione culturale e industriale

              Contattaci subito

              LEGGI ANCHE:

              Intelligenza artificiale

              DragGAN: con l’AI Google rivoluziona l’editing delle immagini

              DragGAN, l’avanzato strumento di editing fotografico basato su IA. Trasforma immagini con precisione e velocità. Uscita prevista: Giugno 2023

              I ricercatori di Google hanno recentemente rilasciato una nuova tecnica di intelligenza artificiale. Consente agli utenti di manipolare le immagini in pochi secondi con un semplice clic e trascinamento. 

              Il nuovo DragGAN è uno strumento di editing AI che sfrutta un GAN (Generative Adversarial Network) pre-addestrato per sintetizzare idee che seguono con precisione l’input dell’utente pur rimanendo sulla molteplicità di immagini realistiche.

              Il potere di DragGAN

              DragGAN è una rivoluzionaria tecnologia di fotoritocco basata sull’intelligenza artificiale che promette di cambiare radicalmente il modo in cui modifichiamo le immagini. Questo nuovo strumento di editing offre un approccio completamente diverso rispetto ai tradizionali software di fotoritocco come Photoshop. DragGAN eliminerà la complessità e gli infiniti livelli di Photoshop, aprendo la strada a qualcosa di completamente nuovo e innovativo.

              DragGAN si basa sull’intelligenza artificiale e utilizza algoritmi avanzati per trasformare le immagini in modo preciso e veloce. Grazie a questa tecnologia, sarà possibile apportare modifiche e miglioramenti alle immagini con estrema precisione, consentendo agli utenti di ottenere risultati sorprendenti con facilità, come nel video seguente:

              Secondo quanto riportato, DragGAN sarà disponibile a partire dal mese di giugno 2023.

              Nonostante non siano disponibili ulteriori dettagli specifici sull’uso e sulle funzionalità esatte di DragGAN, si prevede che questo strumento avrà un impatto significativo nel campo del fotoritocco, semplificando il processo di editing delle immagini.

              In conclusione, DragGAN è un innovativo strumento di editing fotografico basato sull’intelligenza artificiale che sta per rivoluzionare il modo in cui modifichiamo le immagini. Con la promessa di semplificare il processo di fotoritocco e offrire risultati sorprendenti, DragGAN è sicuramente un’interessante tecnologia da tenere d’occhio

                Contattaci subito

                LEGGI ANCHE:

                Intelligenza artificiale

                Chat GPT: tutto quello che c’è da sapere

                Chat GPT è un nuovo strumento di OpenAI che mira a rendere l’interazione con i sistemi di intelligenza artificiale più naturale e intuitiva

                L’intelligenza artificiale conversazionale ha fatto molta strada negli ultimi anni, con numerosi modelli e piattaforme sviluppati per consentire alle macchine di comprendere e rispondere agli input del linguaggio naturale. Tra questi c’è Chat GPT, acronimo di Generative Pretrained Transformer: uno strumento di elaborazione del linguaggio naturale (o Natural Language Processing) potente e versatile che utilizza algoritmi avanzati di apprendimento automatico per generare risposte simili a quelle umane all’interno di un discorso.

                Realizzata da OpenAI (organizzazione no profit per la ricerca sull’intelligenza artificiale) con l’obiettivo di ottimizzare la conversazione e facilitare l’utilizzo da parte degli utenti. Questa tecnologia ha il potenziale per migliorare notevolmente il modo in cui interagiamo con le macchine in una vasta gamma di applicazioni, dal servizio clienti alla traduzione linguistica fino alla scrittura creativa.

                Indice

                Come funziona

                La Chat GPT è stata creata per aiutare gli utenti a interagire in modo più semplice e fluido con GPT-3, il terzo modello di Generative Pre-Training (GPT) di OpenAI rilasciato nel 2020. Si tratta di un modello di linguaggio basato su trasformatori che utilizza il deep learning per produrre testi simili a quelli umani. Consente quindi di gestire diverse attività come la risposta a domande e la traduzione automatica.

                Chat GPT

                Per capire come funziona Chat GPT, è utile comprendere la tecnologia alla base dell’elaborazione del linguaggio naturale. Il Natural Language Processing (NLP) è una branca dell’intelligenza artificiale che si concentra sull’interazione tra computer e linguaggio umano. In particolar modo riguarda la programmazione dei computer per elaborare e analizzare le lingue naturali.

                La tecnologia NLP consente alla Chat GPT di comprendere i modelli e le sfumature del linguaggio umano. Tutto questo è essenziale per generare risposte pertinenti e coerenti. Ciò è possibile grazie all’uso di algoritmi di machine learning, che vengono addestrati su una grande quantità di dati di testo.

                Uno dei principali vantaggi della Chat GPT è la sua capacità di “imparare” dalle conversazioni che ha con gli utenti. In questo modo, il sistema è in grado di adattarsi ai diversi stili di interazione e di offrire risposte sempre più personalizzate.

                A cosa serve

                Nel servizio clienti, la chat GPT può essere utilizzata per gestire le domande comuni e fornire risposte rapide e accurate così da migliorare l’esperienza del cliente e ridurre il carico di lavoro degli operatori. 

                Nella traduzione linguistica, può aiutare a tradurre il testo da una lingua all’altra, abilitando una comunicazione più fluida tra persone che parlano lingue diverse. Nella scrittura creativa, la Chat GPT può aiutare gli scrittori ad esplorare nuove idee ed espandere la propria creatività.

                Ancora, la Chat GPT può essere utilizzata per migliorare gli assistenti personali virtuali. Con Chat GPT, i chatbot potrebbero diventare più conversazionali e maggiormente in grado di assistere gli utenti con una vasta gamma di attività come la pianificazione, la formulazione di raccomandazioni e la fornitura di informazioni.

                nlp

                Un altro campo in cui può avere un impatto significativo è quello dell’istruzione, dove può essere utilizzata per creare esperienze di apprendimento interattive. Fornendo un feedback personalizzato e in tempo reale agli studenti, Chat GPT può migliorare i risultati dell’apprendimento e rendere l’istruzione più efficace e accessibile a una più ampia gamma di persone.

                La Chat GPT può essere utilizzata per condurre sondaggi su un gran numero di persone in modo rapido ed efficiente come per analizzare il sentiment di grandi quantità di dati di testo, come i post sui social media, per identificare tendenze e modelli nell’opinione pubblica.

                Man mano che la tecnologia continua a migliorare, diventerà ancora più efficace nella simulazione della conversazione umana, il che la renderà uno strumento prezioso per aziende e organizzazioni.

                Limiti e sfide

                Sebbene offra molti vantaggi, ha anche i suoi limiti e le sue sfide. È importante esserne consapevoli e utilizzare la chat GPT in modo responsabile ed etico.

                Anche se la Chat GPT viene addestrata su una grande quantità di dati di testo, può avere difficoltà a comprendere il contesto di una conversazione o le sfumature del linguaggio umano. Ciò può portare a risposte imprecise o irrilevanti.

                A volte i dati possono contenere distorsioni che si riflettono nelle risposte generate dalla Chat GPT. Questo può essere particolarmente problematico quando si tratta di argomenti delicati come la razza, il genere o la politica. E visto che sempre questi dati possono contenere informazioni sensibili, ciò solleva preoccupazioni sulla privacy e sull’uso etico di questa tecnologia.

                chat GPT

                Inoltre, la chat GPT è più efficace nel fornire risposte specifiche basate sui fatti piuttosto che nel gestire domande a risposta aperta o concetti astratti. Ciò può limitare la sua utilità in determinate situazioni, come la scrittura creativa o il supporto emotivo.

                Come usare gratis la Chat GPT

                OpenAI, la società dietro la Chat GPT, offre un programma beta che consente a sviluppatori e ricercatori di accedere e utilizzare questa tecnologia gratuitamente. Basta registrare un account sul sito web (https://chat.openai.com/auth/login) e richiedere l’accesso al programma beta compilando un modulo. 

                Visto che è limitato e concesso su base continuativa, potrebbe essere necessario un po’ di tempo per l’approvazione. Ottenuta l’approvazione, si avrà accesso all’API GPT-3 di OpenAI, che consente di integrare la chat GPT nelle applicazioni.

                L’API GPT-3 è gratuita, ma richiede una carta di credito per l’autenticazione. Il programma di OpenAI include l’accesso anche a una serie di altre risorse e strumenti, come tutorial e codice di esempio, che possono aiutare a conoscere le funzionalità della Chat GPT ed esplorare diverse applicazioni e usi della tecnologia. 

                Chat GPT

                L’obiettivo di OpenAI è quello di rendere i sistemi di intelligenza artificiale più facili e piacevoli da utilizzare tanto quanto più sicuri e affidabili grazie al feedback degli utenti.

                LEGGI ANCHE:

                Applicazioni, Database, Formazione, Intelligenza artificiale, Smartphone

                Una Lens in più per la ricerca di Chrome

                Il modulo per il riconoscimento visivo di oggetti, codici a barre e testi stampati, Lens, basato sull’IA è disponibile anche all’interno della casella di ricerca del browser Chrome, che ora ha una marcia in più.

                Google investe da anni diversi milioni di dollari sulle più avanzate tecnologie di riconoscimento audio video basate sull’intelligenza artificiale (IA). Inizialmente il riconoscimento visivo era possibile solo scaricando l’app Lens. Successivamente però, dopo un breve periodo però questo sistema è stato integrato nell’app Google Foto (all’inizio solo per chi aveva uno smartphone Pixel) e nella casella di ricerca Google. Oggi anche chi non ha uno smartphone Pixel e non vuole scaricare l’app, può usare il servizio di analisi visiva Lens. Infatti questo è integrato nella casella di ricerca del browser Chrome, identificato dal logo di una fotocamera oppure di un quadrato con un cerchio al centro.

                Lens funziona riuscendo a individuare gli elementi inquadrati attraverso la fotocamera dello smartphone o del tablet. Confrontandoli successivamente con l’enorme database di immagini presenti sui suoi server e propone risultati che il più delle volte sono corretti. In un certo senso si può paragonare Lens a Shazam, l’app che riconosce i titoli delle canzoni ascoltandone poche note. Il meccanismo in fondo è simile. Se Shazam confronta le note registrate con il suo database di brani musicali, Lens confronta le immagini riprese dalla fotocamera con il suo database.

                Automatico o manuale

                Il funzionamento del sistema di riconoscimento delle immagini di Lens non richiede particolari impostazioni, a meno di non trovarsi in situazioni ambigue. Se, per esempio, vogliamo effettuare una ricerca solamente su una parte dell’immagine inquadrata, dovremo semplicemente spostare con le dita il mirino quadrato di ricerca che come impostazione base copre tutta l’immagine. Inoltre potremo suggerire all’app il tipo di ricerca che ci interessa. Se siamo all’interno di un grande magazzino dovremo così selezionare Acquisti. Se invece siamo in un ristorante, selezionando la voce Dove mangiare potremo scattare la foto di un menu o di un alimento e vedere recensioni e ricette.

                Attenzione, però, che per ottenere i migliori risultati nel riconoscimento di un oggetto, di un testo o di un codice a barre, l’immagine deve risultare ben illuminata. Se così non fosse, è consigliabile attivare il flash presente a fianco della fotocamera. Volendo è possibile utilizzare la ricerca di Google Lens su Chrome anche per effettuare il riconoscimento di un’immagine che abbiamo già archiviato in memoria. Per farlo, però, dovremo passare attraverso l’app Google Foto. Aprire poi l’immagine che vogliamo controllare e fare tap sul simbolo di Lens che si trova in basso. Potremo anche indicare la categoria di ricerca che vogliamo eseguire, se per esempio vogliamo identificare un monumento o un quadro. Dovremo fare tap su Luoghi e aspettare qualche secondo per avere la risposta.

                Per identificare un’immagine, Lens la confronta con il suo enorme database online

                Tutti gli smartphone Android, e anche una buona parte di quelli iOS, utilizzano Chrome come browser predefinito. Quindi come motore di ricerca quello di Google. All’interno della casella di ricerca, oltre all’icona del microfono che serve per inserire i termini da ricercare direttamente con la voce, c’è anche l’icona di una fotocamera. Facendoci tap sopra si aprirà una schermata che ci invita a inquadrare con la fotocamera quello che vogliamo cercare. In alternativa è possibile caricare le immagini archiviate sul telefono e che verranno inviate a Google per essere esaminate in tempo reale.

                chrome lens ricerca immagini

                Se, per esempio, sul telefono abbiamo archiviato l’immagine di una bicicletta che ci è piaciuta e vogliamo vedere di quale modello si tratta e quanto possa costare, non dovremo fare altro che farci tap sopra. Eventualmente poi ridurre con le dita la finestra rettangolare di ricerca per evidenziarla meglio. Visualizzeremo quindi un elenco di immagini corrispondenti. Naturalmente i risultati migliori si otterranno avendo a disposizione immagini di oggetti ben illuminati e facilmente riconoscibili. Lens, in realtà, non si limita a riconoscere gli oggetti, ma può anche identificare monumenti, piante, animali. Tutti elementi, cioè, che sono già presenti tra i miliardi di immagini ospitate nei server di Google e che rappresentano perciò il suo principale patrimonio.

                Riconoscimento dei codici a barre

                La seconda possibilità è quella di inquadrare direttamente con la fotocamera ciò che abbiamo davanti. Noi, per esempio, abbiamo provato a controllare il codice a barre di un prodotto elettronico in modo da leggere le recensioni disponibili in Rete. E scoprire inoltre se online fosse presente un prezzo più basso. Per fare partire la ricerca, basta un tap sul pulsante di scatto con l’icona della lente d’ingrandimento.

                chrome lens  ricerca codici a barre

                Non scatteremo una vera e propria fotografia, ma invieremo solamente l’immagine a Google e riceveremo una risposta entro pochi secondi. Dalle impostazioni della ricerca potremo decidere se consentire a Google di archiviare l’immagine inviate in modo che risulti utile per successive ricerche, o al contrario potremo se eliminarla immediatamente. Per avere una risposta bastano in media pochi secondi anche se non abbiamo una connessione veloce e il consumo in termini di dati è paragonabile a quello della consultazione di una classica pagina Web.

                Riconoscimento di luoghi, traduzioni e compiti

                Abbiamo visto come Lens riesca a individuare correttamente il contenuto di un’immagine paragonandola a quelle che ospita sui suoi server. In realtà può fare molto di più: riesce, infatti, a riconoscere anche intere parole stampate, e in qualche caso scritte a mano, e si interfaccia con l’app Google Traduttore per fornire una traduzione in tempo reale di cartelli o comunque di testi scritti in oltre cento lingue. Non solo, ma inquadrando calcoli complessi, anche se scritta a mano, è in grado di fornire una soluzione nella maggior parte dei casi corretta.

                testo scritto

                Per forzare questo tipo di ricerca bisogna selezionare nella barra inferiore la voce Testo se si vogliono fare riconoscere delle parole, oppure quella Compiti se vogliamo che vengano risolte delle operazioni o anche equazioni matematiche. Selezionando la voce Traduzione verrà prima di tutto riconosciuto il testo e poi tradotto nella nostra lingua o comunque in quella che indicheremo. La voce Luoghi, infine, permetterà di individuare monumenti e attrazioni turistiche particolari.

                Applicazioni, Cloud Computing, Creative, Digitalizzazione, Formazione, Intelligenza artificiale, Internet, Sistemi, Smartphone, Social media, Software, Tech

                Digitalizza senza riflessi le vecchie foto stampate

                Digitalizza le vecchie foto stampate senza riflessi prima che si rovinino con un’app intelligente che non si limita solamente a scansirle.

                Le stampe fotografiche, soprattutto quelle più vecchie, sono fantastiche da vedere e rivedere, ma hanno il limite che con il tempo tendono a deteriorarsi. Per questo motivo è consigliabile scansirle al più presto in modo da archiviarle e proteggerle praticamente all’infinito. La soluzione più semplice, se abbiamo a disposizione un classico scanner piano o anche una stampante multifunzione, resta quella di scansirle e trasferirle sul PC.

                In realtà, però, si possono ottenere risultati ancora migliori grazie alle app che aggiungono l’intelligenza artificiale alla semplice cattura della foto. Nel Play Store di Android sono moltissime le app dedicate alla scansione e al recupero delle fotografie. Noi però questa volta abbiamo voluto provare un’app di Google come FotoScan che, oltre a permettere di catturare nel modo migliore qualsiasi foto, ha anche l’indubbio vantaggio di essere completamente gratuita.

                Niente riflessi

                Insieme ai graffi e ai segni del tempo, uno dei maggiori problemi per chi vuole digitalizzare vecchie foto stampate con il proprio smartphone è costituito dai riflessi. Soprattutto se usiamo il flash, in modo da avere un’illuminazione ottimale, è praticamente certo che qualche riflesso risulterà nella scansione. Teoricamente sarebbe possibile eliminarlo a posteriori. In pratica è molto più semplice farlo prima, utilizzando un’app come quella di Google che ci fa riprendere la stessa immagine da quattro angolature diverse in modo da ottenere alla fine un risultato ottimale.

                Digitalizza senza riflessi le vecchie foto stampate

                Oltre a catturare la fotografia, anche se questa si trova su un tavolo, l’app si occupa di ritagliarla nella maniera migliore. Inoltre ci lascia comunque la possibilità di agire direttamente sul “taglierino” se il risultato non è gradito. Naturalmente, siccome entra in gioco l’intelligenza artificiale, la risoluzione finale dell’immagine potrebbe essere inferiore rispetto a quella ottenibile con un classico scanner piano. Tuttavia in compenso la resa dei colori e delle luci sarà decisamente migliore. Per ottenere questo risultato Google utilizza le stesse tecniche di “fotografia computazionale” usate dalla funzione Panorama degli smartphone, che mette insieme più immagini per costruire una foto panoramica.

                L’operazione di unione delle immagini avviene sui server di Google per cui servirà una connessione attiva e ci saranno i soliti problemi di privacy che comunque sono ben conosciuti a chi sincronizza le proprie fotografie in cloud. Se invece volessimo anche eliminare graffi e segni presenti sulla fotografia, dovremo ricorrere a un programma di ritocco evoluto come Photoshop. Oppure, per i difetti meno evidenti, anche a un’app specifica come Photo Retouch che consente anche di eliminare eventuali oggetti che disturbano l’immagine.

                L’elaborazione dell’immagine catturata con la fotocamera avviene nei server di Google

                Trattandosi di un’app realizzata da Google, FotoScan non richiede registrazioni particolari. Una volta installata, verrà visualizzato un breve tutorial in italiano che spiega molto semplicemente come funziona l’app. In pratica, si tratta di scattare quattro fotografie spostando la fotocamera su un cerchio alla volta (mostrato sullo schermo) in modo da eliminare fastidiosi riflessi e salvare l’immagine migliore. Nella prima cattura si vede bene come la fotografia presenti almeno due riflessi luminosi particolarmente evidenti. Per eliminarli dovremo semplicemente cliccare sull’icona di scatto in basso e seguire le istruzioni in italiano presenti sull’immagine.

                immagine 1
                1

                Immagini pulite in pochi passi

                Come impostazione standard è attivo sia il flash che la modifica da remoto sui server di Google. Rimane comunque possibile escludere entrambe le opzioni, in questo modo avremo sicuramente molti meno riflessi ma allo stesso tempo l’immagine risulterà anche meno luminosa. Se poi non vogliamo che la foto venga elaborata da Google perché teniamo alla nostra privacy, potremo ritagliarla direttamente con lo strumento Taglierino che è integrato all’interno dell’app.

                Come si vede dalla seconda immagine, ci siamo spostati sul secondo cerchio come richiesto dall’app. Una volta mossa la fotocamera, dovremo aspettare qualche secondo affinché l’immagine possa essere elaborata dai server di Google e poi potremo passare al cerchio successivo. Al termine dell’acquisizione delle immagini l’app provvederà anche al ritaglio automatico della fotografia e alla correzione prospettica se l’immagine non dovesse risultare esattamente in piano. Può capitare che l’operazione di ritaglio non sia perfetta, e per questo l’app ci lascia la possibilità di modificarla direttamente utilizzando i cursori a forma di cerchio presenti negli angoli dell’immagine.

                immagine 2
                2

                Oltre a non inclinare lo smartphone durante la scansione, è importante sistemare la foto su una superficie piana che sia in contrasto con la foto stampata. È chiaramente sconsigliabile catturare immagini di fotografie che si trovano in porta foto in vetro. Secondo Google è anche importante assicurarsi che il flash sia attivo in modo da rimuovere ombre e riflessi dalla nostra vecchia foto stampata e ottenere in generale delle foto migliori durante la digitalizzazione.

                immagine 3
                3

                Nella terza immagine in alto possiamo vedere come Google abbia ritagliato in maniera corretta i bordi dell’immagine, lasciandoci comunque la possibilità di modificarli.

                Google Foto

                Una volta salvata l’immagine, la potremo salvare automaticamente all’interno di Google Foto e quindi nel cloud Google Drive, oppure condividerla con i nostri contatti social o ancora attraverso la posta elettronica. Una volta installata l’app non saremo sempre costretti ad aprirla per scansire le immagini, ma potremo farlo direttamente dall’app Google Foto selezionando la voce Raccolta e da qui facendo tap prima su Utilità e quindi su “Scansiona Foto” con FotoScan. Rispetto a uno scanner classico, il vantaggio è sicuramente quello della velocità e della precisione nel rimuovere riflessi e artefatti. Il limite è la definizione che risulterà inferiore all’originale. Nel nostro caso l‘immagine che abbiamo scansito è stata ridimensionata a una risoluzione di 1.500×2.000 pixel rispetto a quella originale di 3.000×4.000 pixel. Si tratta, in pratica, di un dimezzamento della risoluzione che comunque a nostro parere non va a influire particolarmente sull’effetto finale.

                contattaci