Al giorno d'oggi, che si tratti di riconoscimento facciale, robot intelligenti o guida autonoma, si basano tutti sulla percezione della profondità dell'ambiente circostante. A tal fine, sono emerse una serie di tecnologie di percezione della profondità 3D avanzate, comprese quelle tradizionali come telecamere TOF, telecamere a luce strutturata, telecamere di visione stereo e lidar. Quindi, credo che tutti abbiano avuto una domanda del genere quando si sceglie una fotocamera di profondità 3D: quale fotocamera 3D soddisfa le mie esigenze? TOF o altre telecamere di profondità 3D?
Quindi, in questo articolo, comprenderemo profondamente le caratteristiche e le differenze tra TOF e altre telecamere di profondità 3D e perché TOF è più popolare rispetto ad altre telecamere di profondità 3D.
Cos'è la mappatura della profondità 3D?
Cos'è la percezione della profondità 3D? La mappatura della profondità 3D, chiamata anche il rilevamento della profondità o la mappatura 3D, crea un'immagine di uno spazio tridimensionale o di un oggetto target misurando la distanza tra il sensore e ogni punto nell'ambiente circostante. La tecnologia prevede la proiezione di luce sull'oggetto dell'otturatore e la cattura della luce riflessa con una fotocamera o un sensore.
Quindi, analizzando i tempi o il modello dei riflessi, viene calcolata la distanza tra la fotocamera e diverse parti della scena per creare una mappa di profondità. La mappa di profondità è essenzialmente una rappresentazione digitale di quanto sia lontana ogni parte della scena dal punto di vista del sensore.

È proprio a causa di questa caratteristica delle telecamere di profondità 3D che ha svolto un ruolo incommensurabile in più settori. Quindi, prima di confrontare TOF e altre tecnologie di mappa 3D, diamo un'occhiata alle loro caratteristiche una per una.
Che cos'è il momento dell'imaging del volo?
In articoli precedenti, abbiamo appreso che il momento del volo è semplicemente il tempo impiegato dalla luce per raggiungere un oggetto, riflettere e tornare al sensore. Attraverso questa misurazione, una fotocamera TOF può determinare la distanza di vari oggetti nella scena da se stessa. I componenti principali di una fotocamera TOF includono il sensore TOF e il modulo del sensore, che cattura la luce riflessa e la converte in dati che la fotocamera può elaborare.
Di solito utilizzano fonti di luce come VCSel o LED che emettono luce nello spettro del vicino infrarosso (NIR). Inoltre, il sensore di profondità elabora questi dati grezzi, filtrando il rumore e altre inesattezze per fornire chiari informazioni di profondità.
Come funziona una fotocamera TOF?
Il principio di lavoro di una fotocamera TOF è come un "campo di eco di luce". Emette un impulso di luce noto (di solito luce a infrarossi), quindi misura accuratamente il tempo impiegato per riflettere l'impulso di luce dall'oggetto. Sulla base del principio secondo cui la velocità della luce è costante, è possibile calcolare la distanza che la luce viaggia, generando così informazioni di profondità per ciascun punto della scena.
I suoi vantaggi sono forti prestazioni in tempo reale e la capacità di ottenere rapidamente mappe di profondità; dimensioni compatte e consumo di energia relativamente basso; Bassa dipendenza dalla consistenza superficiale dell'oggetto target e può funzionare anche su superfici debolmente strutturate.
Per maggiori dettagli sulle telecamere TOF, leggi:Sensore TOF: principio di lavoro e analisi dei componenti core.
Cos'è la tecnologia di visione stereo? Come funzionano le telecamere di visione stereo?
La visione stereo imita il modo in cui l'occhio umano funziona e la disparità stereo si riferisce alla differenza nella posizione dell'immagine di un oggetto visto dagli occhi sinistra e destra. Utilizza due (o più) telecamere per catturare contemporaneamente immagini della stessa scena da prospettive leggermente diverse. Il sistema utilizza il principio della triangolazione per calcolare la profondità di un oggetto identificando la disparità tra i punti corrispondenti nelle due immagini - cioè la differenza nella posizione relativa dell'oggetto nelle due immagini, combinata con i parametri geometrici della fotocamera (come la distanza di base). Per questo sono necessari due concetti:
- Basale:Questa è la distanza tra le due telecamere (circa 50–75 mm - distanza della pupilla).
- Risoluzione:Proporzionale alla profondità. Più pixel cercavano, maggiore è il numero di livelli di disparità (ma anche il carico computazionale è più alto).
La lunghezza focale è proporzionale alla profondità di campo. Più corta è la lunghezza focale, più lontano puoi vedere, ma anche il campo visivo sarà ridotto. Maggiore è la lunghezza focale, più vicina alla profondità di campo e maggiore è il campo visivo. Le telecamere di visione stereo si basano su questa tecnologia.
I vantaggi di questa tecnologia sono che è un costo relativamente basso, soprattutto quando non è necessaria alcuna fonte di luce attiva; Può catturare immagini a colori e informazioni di profondità.
Cos'è l'imaging della luce strutturata? Come funziona una fotocamera leggera strutturata?
Progetti di tecnologia di luce strutturata noti modelli di luce noti, come punti, strisce o motivi codificati, in una scena, quindi utilizzano una fotocamera per catturare la distorsione di questi motivi sulla superficie di un oggetto a causa di cambiamenti di profondità. Analizzando queste distorsioni e usando il principio della triangolazione, il sistema può calcolare accuratamente la forma tridimensionale e le informazioni di profondità dell'oggetto.
Le telecamere di luce strutturate si basano anche su questa tecnologia, utilizzando modelli proiettati appositamente progettati per migliorare la capacità della fotocamera di identificare e misurare i cambiamenti nella superficie che illumina. Elaborando i cambiamenti nella distorsione del pattern per calcolare la distanza dalla fotocamera a ciascun punto sulla superficie dell'oggetto, viene creata una mappa 3D dell'oggetto.

Ciò può fornire una precisione di profondità molto elevata a distanza ravvicinata (di solito entro 1 metro), particolarmente adatto per applicazioni con dettagli ricchi, come la scansione 3D, il riconoscimento dei gesti, ecc.
Cos'è Lidar?
Lidar lavora in modo simile a TOF e determina anche la distanza emettendo travi laser e misurando il tempo di volo. Ma a differenza delle telecamere TOF, che di solito catturano la profondità di un'area, i sistemi LIDAR di solito emettono raggi laser discreti e le scansionano per costruire una mappa delle nuvole di punti estremamente dettagliata e ad alta risoluzione. A seconda del tipo, il lidar può essere diviso in meccaniche (con parti rotanti) e a stato solido.
I vantaggi di questo sono lunghe distanze di rilevamento, fino a centinaia di metri; precisione estremamente elevata, particolarmente adatta per la percezione ambientale su larga scala e la mappatura ad alta precisione; e eccellenti prestazioni in forte luce esterna.
La differenza tra telecamere TOF e altre telecamere di profondità 3D
Ogni fotocamera tecnologica di imaging 3D ha i suoi vantaggi e svantaggi. Di seguito usiamo un grafico per confrontare la differenza tra le telecamere TOF e altre telecamere di visione stereo 3D.
| Dimensione della caratteristica | TOF Camera (tempo di volo) | Luce strutturata | Visione stereo | Lidar |
| Principio di lavoro | Misura il tempo di andata e ritorno degli impulsi di luce | Progetti noti modelli, analizza la distorsione per calcolare la profondità | Setup a doppia o multi-fotocamera, calcola la profondità tramite disparità | Scansioni ed emette travi laser, misura il tempo di volo |
| Precisione | Millimetro a livello centimetro | Micrometro a livello millimetro (eccellente a distanza ravvicinata) | Livello centimetro (fortemente influenzato dalla consistenza, distanza) | Millimetro a livello centimetro (alta precisione su lunghe distanze) |
| Distanza/intervallo di rilevamento | Gamma media a corta (diversi metri a decine di metri) | Corto raggio (in genere entro 1 metro) | Range medio -corto (influenzato dalla linea di base) | A lungo raggio (decine a centinaia di metri) |
| Adattabilità alla luce ambientale | Illuminazione attiva, un po 'di anti-interferenza; Le prestazioni si degrada nella forte luce diretta | Illuminazione attiva, motivi facilmente "lavati" dalla forte luce solare | Passivo, si basa fortemente sulla luce e sulla consistenza ambientale; scarse prestazioni in condizioni di scarsa luminosità | Illuminazione attiva, forte resistenza alla luce ambientale |
| Performance all'aperto | La sfida è l'interferenza a infrarossi dalla luce solare; richiede un'elaborazione aggiuntiva | Incline all'interferenza della luce solare | Si basa sulla luce naturale; La mancanza di consistenza è un problema | In genere si esibisce migliori all'aperto |
| Complessità computazionale | Emette direttamente la profondità, relativamente bassa | Richiede analisi di deformazione del modello, media complessità | Richiede una corrispondenza complessa di funzionalità, alta complessità | Grande volume di dati, ma l'elaborazione del cloud point è relativamente diretta |
| Dimensioni e complessità | Di solito la maggior parte compatta, senza parti meccaniche | Include proiettore e fotocamera, dimensioni moderate | Due telecamere, dimensioni moderate | Di solito più grandi, alcuni con parti rotanti meccaniche |
| Costo | Relativamente conveniente | Medio | Più basso (se si utilizzano telecamere esistenti) | Di solito il più alto |
| Applicazioni tipiche | AR mobile/Sensità di profondità, Evitamento degli ostacoli del robot, Riconoscimento dei gesti, Monitoraggio delle auto | Sblocco del riconoscimento facciale, misurazione di precisione, ispezione industriale | Navigazione robot, evitamento dell'ostacolo dei droni, AR/VR (in scene strutturate) | Guida autonoma, mappatura ad alta precisione, città intelligenti |
Perché le telecamere tempo di volo (TOF) sono una scelta migliore per la mappatura 3D?
La tabella sopra ci fornisce una comprensione preliminare delle differenze tra le telecamere TOF e altre telecamere di profondità 3D. Quindi, perché le telecamere TOF sono una scelta migliore per la misurazione 3D? Abbiamo riassunto i seguenti fattori:
- Accuratezza di imaging superiore:A causa della dipendenza dall'illuminazione precisa della fonte di luce, le telecamere TOF forniscono una migliore uscita della qualità dell'immagine.
- Complessità software ridotta:Le telecamere TOF forniscono dati di profondità direttamente dal modulo, evitando situazioni complesse come gli algoritmi di corrispondenza della profondità in esecuzione nella piattaforma host.
- Scalabilità della profondità più elevata:Le telecamere TOF hanno un intervallo di profondità scalabile con il numero di VCSel utilizzati per l'illuminazione.
- Migliori prestazioni in condizioni di scarsa illuminazione:Le telecamere TOF funzionano meglio in condizioni di scarsa illuminazione a causa di fonti di luce attive e affidabili.
- Dimensione compatta:Poiché il sensore e l'illuminazione possono essere messi insieme, le telecamere TOF hanno un fattore di forma più compatto.
Aree di applicazione comuni delle telecamere del tempo
- Mobile AR (realtà aumentata)/Effetto profondità fotografica:I telefoni cellulari devono essere sottili, leggeri, a bassa potenza e in grado di acquisire informazioni di profondità in tempo reale. Le telecamere TOF sono ideali per le loro dimensioni ridotte, buone prestazioni in tempo reale e bassa dipendenza dalla trama.
- Riconoscimento dei gesti/posizionamento spaziale nelle cuffie VR/AR:Sono inoltre richiesti monitoraggio dei gesti in tempo reale e accurato e percezione dell'ambiente interno. Le telecamere TOF possono fornire dati di profondità a bassa latenza, che sono molto adatti a tali applicazioni interattive.
- Monitoraggio del driver/riconoscimento dei gesti:Di solito utilizzato nell'auto per brevi distanze, con requisiti per prestazioni, dimensioni e costi in tempo reale. Le telecamere TOF sono una soluzione molto adatta.
- Riconoscimento/ordinamento degli oggetti:Identifica la forma, le dimensioni e la posizione degli oggetti in modo che i robot possano afferrarli e classificarli. Le telecamere TOF possono fornire rapidamente informazioni di contorno tridimensionale degli oggetti.

Per saperne di più sul ruolo dei moduli della fotocamera in applicazioni specifiche, leggi:
Cos'è un modulo fotocamera autofocus? Come funziona?
Cos'è un modulo fotocamera a bassa luce? capire in profondità
Per saperne di più sui sistemi di visione artificiale, leggi:
Visione incorporata rispetto alla visione macchina: comprendere le differenze chiave
Come scegliere la giusta tecnologia di rilevamento della profondità 3D per il tuo progetto?
Di fronte a una varietà di tecnologie di rilevamento della profondità 3D, dovremmo capire come scegliere quello adatto alle nostre esigenze del progetto. Ecco alcune considerazioni chiave:
- Requisiti di applicazione chiari:Questo è il primo e più critico passo.
- Requisiti di precisione:La tua applicazione richiede una precisione a livello millimetro, di livello centimetro o inferiore?
- Distanza di rilevamento:Devi percepire la distanza ravvicinata (decine di centimetri), una distanza media (diversi metri) o una lunga distanza (decine di metri o più)?
- Condizioni ambientali:Il tuo sistema funzionerà all'interno, all'esterno, in forte luce, in condizioni di scarsa luce o in completa oscurità?
- Requisiti in tempo reale:Quanto velocemente i dati devono essere aggiornati?
- Caratteristiche dell'oggetto target:Il target è trasparente, riflettente, riccamente strutturato o liscio e senza testure?
- Output dei dati:Hai bisogno di una mappa di profondità, una nuvola di punti o un altro formato?
- Considera i vincoli di budget e dimensioni:Il costo e le dimensioni fisiche sono spesso fattori che non possono essere ignorati nei progetti reali. Alcune soluzioni ad alta precisione a lunga distanza possono essere costose e ingombranti.
- Valutare la complessità dell'elaborazione dei dati e difficoltà di sviluppo:Alcune tecnologie possono generare enormi quantità di dati, che richiedono risorse di elaborazione più potenti e algoritmi più complessi da elaborare.
- Test e verifica:Il più possibile test e verifica dei prototipo negli scenari di applicazione effettivi sono il modo migliore per valutare le prestazioni e la fattibilità della tecnologia.
Quando si sceglie un modulo della fotocamera, anche il tipo di interfaccia, il fornitore, i requisiti di personalizzazione, ecc. Sono importanti. Si prega di leggere:
Il fattore alla scelta dell'interfaccia corretta per un sistema di visione incorporato?
I vantaggi della scelta dei moduli della fotocamera personalizzati per lo sviluppo del prodotto
Conclusione
Nel campo della percezione della profondità 3D, nessuna singola tecnologia è una panacea. Le telecamere TOF, la luce strutturata, la visione stereo e il lidar hanno ciascuno vantaggi tecnici unici e scenari applicabili. TOF brilla in applicazioni a corto e medio raggio con la sua in tempo reale e compattezza; La luce strutturata non ha eguali in precisione ravvicinata; Stereo Vision fornisce soluzioni flessibili con il suo rapporto costo-efficacia e caratteristiche passive; e Lidar domina in ambienti esterni complessi con la sua lunga distanza e alta precisione. Alla fine dobbiamo fare delle scelte in base alle esigenze effettive del progetto.
Naturalmente, se hai difficoltà a trovare una fotocamera di imaging 3D adatta,Si prega di contattarci.MuchVision ha più di dieci anni di esperienza nel campo della visione incorporata e ha prodotto molti moduli per fotocamere ad alte prestazioni, compresi i moduli per le telecamere di misurazione 3D. Credo che con il nostro team di ingegneri professionisti, possiamoTrova la soluzione giusta per te.
FAQ
D1: TOF e LIDAR sono la stessa cosa?
A1:Non esattamente. TOF (tempo di volo) è un principio di misurazione della distanza e Lidar (radar laser) è un sistema che applica il principio TOF. Tutti i lidari usano il principio TOF per misurare la distanza, ma i sensori TOF e le telecamere TOF di solito si riferiscono a soluzioni più compatte e a basso costo, spesso utilizzate in scenari a distanza più brevi. Lidar di solito si riferisce a sistemi che emettono e scansionano i fasci laser e costruiscono nuvole di punti ad alta densità per ottenere misurazioni ad alta precisione a lunghe distanze (come per la guida autonoma). Puoi capire che Lidar è un'applicazione di fascia alta del principio TOF in sistemi più complessi e più grandi.
Q2: quale sensore di profondità 3D è il più accurato?
A2:Dipende dalla distanza. A distanze molto ravvicinate (decine di centimetri a 1 metro), la luce strutturata di solito fornisce l'accuratezza della profondità più alta, fino a livelli di micron o persino sub-millimetro. A media e brevi distanze (diversi metri rispetto a decine di metri), le telecamere TOF possono fornire dati di profondità in tempo reale al millimetro a livello centrale. A lunghe distanze (decine a centinaia di metri), Lidar può mantenere un'eccellente precisione di millimetro a centimetro e ottenere nuvole di punti ad alta densità. L'accuratezza della visione stereo è limitata dalla distanza di base e dalla trama dell'immagine, di solito a livello centimetro.
Q3: quale è meglio per uso esterno, luce strutturata o TOF?
A3:In generale, le telecamere TOF funzionano meglio della luce strutturata in forte luce esterna. La tecnologia della luce strutturata si basa su modelli proiettati, che possono essere facilmente "sbiaditi" o sommersi dalla luce ambientale alla forte luce solare, con conseguente riconoscimento impreciso. Sebbene le telecamere TOF siano influenzate anche dalla componente a infrarossi della luce solare, sono relativamente più robuste attraverso filtri a banda stretta e ottimizzazione dell'algoritmo. Lidar si esibisce meglio all'aperto perché di solito utilizza laser a potenza più elevata e tecnologia di filtraggio più avanzate.






