Näkö on voimakas ihmisen aistisyöte. Se mahdollistaa monimutkaiset tehtävät ja prosessit, joita pidämme itsestäänselvyytenä. Kun AoT™ (Asioiden autonomia) lisääntyy erilaisissa sovelluksissa kuljetuksista ja maataloudesta robotiikkaan ja lääketieteeseen, kameroiden, tietojenkäsittelyn ja koneoppimisen rooli ihmisen kaltaisen näön ja kognition tarjoajana on tulossa merkittäväksi. Tietokonenäkö akateemisena tieteenalana sai nousun 1960-luvulla ensisijaisesti yliopistoissa, jotka harjoittavat kehittyvää tekoälyä (AI) ja koneoppimista. Se edistyi dramaattisesti seuraavien neljän vuosikymmenen aikana, kun puolijohde- ja laskentateknologioissa saavutettiin merkittävää edistystä. Viimeaikaiset edistysaskeleet syväoppimisessa ja tekoälyssä ovat entisestään kiihdyttäneet tietokonenäön soveltamista reaaliaikaisen, matalan latenssin havainnon ja ympäristön kognition tarjoamiseen, mikä mahdollistaa autonomian, turvallisuuden ja tehokkuuden erilaisissa sovelluksissa. Liikenne on yksi alue, joka on hyötynyt merkittävästi.
LiDAR (Light Detection and Ranging) on aktiivinen optinen kuvantamismenetelmä, joka käyttää lasereita kohteen ympärillä olevan 3D-ympäristön määrittämiseen. Se on yksi teknologioista, joita tietokonenäköratkaisut (jotka perustuvat puhtaasti ympäristön valoon eivätkä käytä lasereita 3D-havaintoon) yrittävät häiritä. Yleinen teema on, että ihmiskuljettajat eivät tarvitse LiDAR:ia syvyyden havaitsemiseen, joten ei myöskään koneet. Nykyiset kaupalliset L3-autonominen ajoominaisuudet (täydellinen autonomia tietyissä maantieteellisissä alueilla ja sääolosuhteissa, kuljettaja on valmis ottamaan hallinnan sekunneissa) -tuotteet tänään käytä LiDARia. Puhtaasti visioon perustuvat tekniikat eivät ole vieläkään kyenneet tarjoamaan tätä kykyä kaupallisesti.
ILMOITUS
Tesla
Muut yritykset, kuten Phiar, Helm.ai ja NODAR pyrkivät myös tietokonenäköön. NODAR pyrkii laajentamaan merkittävästi stereokamerajärjestelmien kuva-aluetta ja 3D-havaintoa oppimalla mukautumaan kameran kohdistusvirheisiin ja tärinävaikutuksiin patentoitujen koneoppimisalgoritmien avulla. Se keräsi äskettäin 12 miljoonaa dollaria lippulaivatuotteensa, Hammerhead™:n tuotteistamiseen, joka hyödyntää "valmiita" autoteollisuuden kameroita ja tavallisia laskenta-alustoja.
Kustannusten ja koon lisäksi yleinen argumentti LiDARin käyttöä vastaan on se, että sen kantama ja resoluutio on rajoitettu kameroihin verrattuna. Esimerkiksi LiDAR-laitteet, joiden kantama on 200 m ja 5-10 M pistettä sekunnissa (PPS muistuttaa resoluutiota), ovat nykyään saatavilla. 200 metrin korkeudessa pienet esteet, kuten tiilet tai renkaiden roskat, havaitsevat hyvin vähän pisteitä (ehkä 2-3 pystysuunnassa ja 3-5 vaakasuunnassa), mikä vaikeuttaa kohteen tunnistamista. Asiat muuttuvat vieläkin karkeammiksi pitemmillä etäisyyksillä. Vertailun vuoksi voidaan todeta, että 30 Hz:n taajuudella toimivat tavalliset megapikselikamerat voivat tuottaa 30 megapikseliä sekunnissa, mikä mahdollistaa ylivoimaisen kohteentunnistuksen jopa pitkillä etäisyyksillä. Edistyneemmät kamerat (12 M pikseliä) voivat lisätä tätä entisestään. Ongelmana on, kuinka hyödyntää tätä valtavaa dataa ja tuottaa toimiva havainto millisekunnin tason latenssien, alhaisen virrankulutuksen ja huonontuneiden valaistusolosuhteiden kanssa.
ILMOITUS
tunnistetuista, kalifornialainen yritys, yrittää ratkaista tämän ongelman. Toimitusjohtaja Mark Bolithon mukaan sen tehtävänä on "tarjoavat yli-inhimillisen visuaalisen havainnon täysin autonomisille ajoneuvoille.” Yritys perustettiin vuonna 2017, se on kerännyt tähän mennessä 75 miljoonaa dollaria ja sillä on 70 työntekijää. RK Anand, Juniper Networksin alumni, on yksi perustajista ja tuotepäällikkö. Hän uskoo, että käyttämällä korkearesoluutioisia kameroita, joiden dynaaminen alue on yli 120 dB ja jotka toimivat suurilla kuvanopeuksilla (esimerkiksi OnSemi, Sony ja Omnivision), tarjoavat tarvittavat tiedot korkearesoluutioisten 3D-tietojen luomiseen, mikä on kriittistä AV:iden toteuttamisessa. Tämän mahdollistajat ovat:
- Räätälöidyt ASIC-kortit käsittelevät tietoja tehokkaasti ja tuottavat tarkkoja ja korkearesoluutioisia 3D-karttoja autoympäristöstä. Nämä on valmistettu TSMC 7 nm:n prosessilla, sirun koko on 100 mm², ja ne toimivat 1 GHz:n taajuudella.
- Omat koneoppimisalgoritmit, jotka käsittelevät miljoonia datapisteitä offline-tilassa ja luovat koulutetun hermoverkon, joka voi sitten toimia tehokkaasti ja oppia jatkuvasti. Tämä verkko tarjoaa havainnon ja sisältää objektien luokittelun ja havaitsemisen, semanttisen segmentoinnin, kaistantunnistuksen, liikennemerkit ja liikennevalotunnistuksen
- Minimoi sirun ulkopuoliset tallennus- ja kertolaskutoiminnot, jotka vaativat paljon virtaa ja luovat suuren viiveen. Recognisin ASIC-suunnittelu on optimoitu logaritmiseen matematiikkaan ja käyttää yhteenlaskua. Lisähyötyjä saavutetaan klusteroimalla painot optimaalisesti koulutetussa hermoverkossa.
Harjoitteluvaiheen aikana kaupallista LiDAR:ia käytetään perustodellisuutena korkearesoluutioisen, suuren dynaamisen alueen stereokameradatan opettamiseen syvyystietojen poimimiseksi ja sen tekemiseksi kestäväksi kohdistusvirheitä ja tärinää vastaan. Herra Anandin mukaan heidän koneoppimistoteutus on niin tehokas, että se voi ekstrapoloida syvyysarvioita kalibrointi-LiDAR:n tarjoamien harjoitusalueiden (joka tarjoaa pohjatotuuden 100 metrin etäisyydelle) ulkopuolelle.
ILMOITUS
Yllä olevat harjoitustiedot suoritettiin päiväsaikaan stereoparilla 8.3 megapikselin kameroita, jotka toimivat 30 Hz:n kuvataajuudella (~0.5 M pikseliä sekunnissa). Se osoittaa koulutetun verkon kyvyn poimia 3D-informaatiota kohtauksesta 100 metrin etäisyydeltä, jolla se harjoitettiin. Recognisin ratkaisu voi myös ekstrapoloida oppimisensa päivätiedoilla yöaikaan (kuva 2).
ILMOITUS
Mr. Anandin mukaan etäisyystiedot ovat 5 prosentin tarkkuudella (pitkillä etäisyyksillä) ja lähes 2 prosentin tarkkuudella (lyhyillä etäisyyksillä). Ratkaisu tarjoaa 1000 TOPS:ia (biljoonaa operaatiota sekunnissa) 6 ms:n viiveellä ja 25 W:n virrankulutuksella (40 TOPS/W), mikä on alan johtava. Kilpailijat, jotka käyttävät kokonaislukumatematiikkaa, ovat > 10X pienempiä tässä mittarissa. Recognisin ratkaisua testataan parhaillaan useilla autoteollisuuden Tier 1 -toimittajilla.
Profetoi ("ennustaa ja nähdä, missä toiminta on", jonka kotipaikka on Ranskassa, käyttää tapahtumapohjaisia kameroitaan AV-laitteissa, Advanced Driver Assistance Systems (ADAS), teollisuusautomaatiossa, kuluttajasovelluksissa ja terveydenhuollossa. Vuonna 2014 perustettu yritys lopetti äskettäin 50 miljoonan dollarin C-kierroksen rahoituksensa, ja tähän mennessä on kerätty yhteensä 127 miljoonaa dollaria. Xiaomi, johtava matkapuhelinvalmistaja, on yksi sijoittajista. Propheseen tavoitteena on jäljitellä ihmisen näkökykyä, jossa verkkokalvon reseptorit reagoivat dynaamiseen informaatioon. Ihmisaivot keskittyvät käsittelyssä tapahtumien muutosten käsittelyyn (etenkin ajamiseen). Perusideana on käyttää kamera- ja pikseliarkkitehtuureja, jotka havaitsevat kynnyksen (tapahtuman) ylittävän valon intensiteetin muutokset ja välittävät vain nämä tiedot laskentapinoon jatkokäsittelyä varten. Pikselit toimivat asynkronisesti (ei kehystetty kuten tavallisissa CMOS-kameroissa) ja paljon suuremmilla nopeuksilla, koska niiden ei tarvitse integroida fotoneja kuten perinteisessä kehyspohjaisessa kamerassa ja odottaa koko kehyksen valmistumista ennen tietojen lukemista. Edut ovat merkittäviä – pienempi datakaistanleveys, päätösviive, tallennustila ja virrankulutus. Yrityksen ensimmäinen kaupallinen VGA-tapahtumapohjainen näkösensori sisälsi korkean dynaamisen alueen (>120 dB), alhaisen virrankulutuksen (26 mW anturitasolla tai 3 nW/tapahtuma). Myös HD (High Definition) -versio (yhdessä Sonyn kanssa kehitetty), jonka pikselikoko on alan johtava (< 5 μm), on myös julkaistu.
ILMOITUS
Nämä anturit muodostavat Metavision®-anturialustan ytimen, joka käyttää tekoälyä älykkään ja tehokkaan havainnoinnin tarjoamiseen itsenäisyyssovelluksille ja jota useat kuljetusalan yritykset arvioivat. Eteenpäin suuntautuvan AV:n ja ADAS:n havaitsemisen lisäksi Prophesee on aktiivisesti tekemisissä asiakkaiden kanssa kuljettajan ohjaamisessa L2- ja L3-sovelluksissa, katso kuva 4:
Autoteollisuuden mahdollisuudet ovat tuottoisia, mutta suunnitteluvaiheet ovat pitkiä. Viimeisten kahden vuoden aikana Prophesee on nähnyt merkittävää kiinnostusta ja vetovoimaa teollisuussovellusten konenäkötilasta. Näitä ovat nopea laskenta, pinnan tarkastus ja tärinän valvonta.
ILMOITUS
Prophesee ilmoitti hiljattain yhteistyöstä johtavien konenäköjärjestelmien kehittäjien kanssa hyödyntääkseen mahdollisuuksia teollisuusautomaatiossa, robotiikassa, autoteollisuudessa ja IoT:ssä (esineiden internet). Muita välittömiä mahdollisuuksia ovat kuvan epäterävyyden korjaus matkapuhelimissa ja AR/VR-sovelluksissa. Nämä käyttävät pienemmän formaatin antureita kuin ne, joita käytetään pidemmän aikavälin ADAS/AV-mahdollisuuksiin, kuluttavat vielä vähemmän virtaa ja toimivat huomattavasti pienemmällä viiveellä.
Israel on korkean teknologian johtava innovaattori, jolla on merkittäviä pääomasijoituksia ja aktiivinen start-up-ympäristö. Vuodesta 2015 lähtien teknologiasektorilla on tehty noin 70 miljardia dollaria pääomasijoituksia. Osa tästä on tietokonenäön alueella. Mobileye johti tätä vallankumousta vuonna 1999, kun Amnon Shashua, johtava heprealaisen yliopiston tekoälytutkija, perusti yrityksen keskittymään kamerapohjaiseen ADAS- ja AV-havaintoon. Yritys haki listautumisannin vuonna 2014, ja Intel osti sen
ILMOITUS
Champel Capital, jonka kotipaikka on Jerusalemissa, investoi eturintamassa yrityksiin, jotka kehittävät tietokonenäköön perustuvia tuotteita erilaisiin sovelluksiin liikenteestä ja maataloudesta turvallisuuteen. Amir Weitman on yksi perustajista ja toimitusjohtaja. Hän perusti venture-yhtiönsä vuonna 2017. Ensimmäinen rahasto sijoitti 20 miljoonaa dollaria 14 yritykseen. Yksi heidän sijoituksistaan oli Innoviziin, joka listautui SPAC-fuusion kautta vuonna 2018 ja josta tuli LiDAR-yksisarvis. Omer Keilafin johtama (joka tuli Israelin puolustusvoimien tiedustelujoukon teknologiayksiköstä) Yritys on nykyään johtava LiDAR-käyttöönotto ADAS- ja AV-laitteissa, ja se on voittanut useita suunnitteluvoittoja BMW:ltä ja Volkswagenilta.
Champel Capitalin toinen rahasto (Impact Deep Tech Fund II) perustettiin tammikuussa 2022, ja se on kerännyt tähän mennessä 30 miljoonaa dollaria (tavoite on 100 miljoonaa dollaria vuoden 2022 loppuun mennessä). Hallitseva painopiste on tietokonenäössä, ja viidellä yrityksellä on käytössä 12 miljoonaa dollaria. Näistä kolme käyttää tietokonenäköä liikenteessä ja robotiikassa.
TankU, Haifassa sijaitseva, aloitti toimintansa vuonna 2018 ja on kerännyt 10 miljoonan dollarin rahoitusta. Dan Valdhorn on toimitusjohtaja ja valmistunut Unit 8200:sta, korkean teknologian eliittiryhmästä Israelin puolustusvoimissa, joka vastaa signaalitiedosta ja koodin salauksen purkamisesta. TankU:n SaaS (Software as a Service) -tuotteet automatisoivat ja turvaavat prosessit monimutkaisissa ulkoilmaympäristöissä, jotka palvelevat ajoneuvoja ja kuljettajia. Näitä tuotteita käyttävät ajoneuvokannan, henkilöautojen, tankkaus- ja sähkölatausasemien omistajat estämään varkaudet ja petokset automatisoiduissa rahoitustapahtumissa. Ajoneuvojen polttoainepalvelut tuottavat vuosittain ~2T dollaria maailmanlaajuisesti, josta yksityiset ja hyötyajoneuvojen omistajat kuluttavat 40 % eli 800 miljardia dollaria. Jälleenmyyjät ja kaluston omistajat menettävät vuosittain noin 100 miljardia dollaria varkauksien ja petosten vuoksi (esimerkiksi käyttäessään polttoainekorttia luvattomille yksityisajoneuvoille). CNP (Card not present) -petokset ja polttoaineen peukalointi/varastaminen ovat lisämenetyslähteitä, varsinkin kun käytetään varastettuja korttitietoja mobiilisovelluksissa maksamiseen.
ILMOITUS
Yrityksen TUfuel-tuote mahdollistaa turvallisen maksamisen yhdellä napautuksella, estää useimmat petokset ja hälyttää asiakkaita, kun se epäilee petosta. Se perustuu tekoälymoottoriin, joka on koulutettu näiden tilojen olemassa olevien CCTV-laitteiden tiedoilla ja digitaalisella tapahtumadatalla (mukaan lukien POS- ja muut taustatiedot). Parametrit, kuten ajoneuvon liikerata ja dynamiikka, ajoneuvon tunnus, matka-aika, kilometrimäärä, tankkausaika, polttoainemäärä, polttoainehistoria ja kuljettajan käyttäytyminen, ovat joitain attribuutteja, joita valvotaan petosten havaitsemiseksi. Nämä tiedot auttavat myös jälleenmyyjiä optimoimaan sivuston toiminnan, parantamaan asiakasuskollisuutta ja ottamaan käyttöön visiopohjaisia markkinointityökaluja. Toimitusjohtaja Dan Valdhornin mukaan heidän ratkaisunsa havaitsee 70 % kalustosta, 90 % luottokorteista ja 70 % peukalointiin liittyvistä petoksista.
Sonol on energiapalveluyritys, joka omistaa ja ylläpitää 240 aseman ja lähikaupan verkostoa eri puolilla Israelia. TUfuel on otettu käyttöön heidän toimipisteillään, ja se on osoittanut parannettua turvallisuutta, petostentorjuntaa ja asiakasuskollisuutta. Tuotekokeet ovat meneillään Yhdysvalloissa yhteistyössä johtavan maailmanlaajuisen huoltoasemien ja lähikauppojen laitteiden toimittajan kanssa. Samanlaisia aloitteita on meneillään myös Afrikassa ja Euroopassa.
ILMOITUS
Tel Avivissa ITC sen perustivat vuonna 2019 Ben-Gurionin yliopiston koneoppimisen tutkijat. ITC luo SaaS-tuotteita, jotka "mittaa liikenteen sujuvuutta, ennakoi ruuhkaa ja lievennä niitä älykkäällä liikennevalojen käsittelyllä – ennen kuin ruuhkat alkavat muodostua." TankU:n tapaan se käyttää valmiiden kameroiden tietoja (joita on jo asennettu useisiin liikenneristeyksiin) reaaliaikaisten liikennetietojen saamiseksi. Tietoja tuhansista kameroista eri puolilla kaupunkia analysoidaan, ja parametrit, kuten ajoneuvotyyppi, nopeus, liikesuunta ja ajoneuvotyyppien järjestys (kuorma-autot vs. henkilöautot), poimitaan patentoitujen AI-algoritmien avulla. Simulaatiot ennustavat liikenteen sujuvuuden ja mahdolliset ruuhkatilanteet jopa 30 minuuttia etukäteen. Liikennevaloja säädetään näiden tulosten perusteella liikenteen sujuvuuden ja ruuhkautumisen estämiseksi.
Tekoälyjärjestelmän kouluttaminen kestää yhden kuukauden visuaalista dataa tyypillisessä kaupungissa ja sisältää yhdistelmän ohjattua ja valvomatonta oppimista. ITC:n ratkaisu on jo käytössä Tel-Avivissa (sijoittui 25. sijalle maailman ruuhkaisimpien kaupunkien joukossa vuonna 2020), ja tuhansia kameroita on asennettu satoihin liikennevaloilla ohjattuihin risteyksiin. ITC:n järjestelmä hallitsee tällä hetkellä 75 XNUMX ajoneuvoa, minkä odotetaan jatkavan kasvuaan. Yritys asentaa a samanlainen kyky sisään Luxemburgissa ja aloittaa kokeet Yhdysvaltojen suurimmissa kaupungeissa. Maailmanlaajuisesti sen ratkaisu hallinnoi 300,000 XNUMX ajoneuvoa, joiden toimipisteet sijaitsevat Israelissa, Yhdysvalloissa, Brasiliassa ja Australiassa. Tekninen johtaja Dvir Kenig on intohimoinen tämän ongelman ratkaisemisessa – antaa ihmisille takaisin henkilökohtaista aikaa, vähentää kasvihuonekaasupäästöjä, parantaa yleistä tuottavuutta ja mikä tärkeintä, vähentää onnettomuuksia ruuhkaisissa risteyksissä. Mr. Kenigin mukaan "Käyttöönottomme osoittavat, että liikenneruuhkat vähenevät 30 %, mikä vähentää tuottamatonta ajoaikaa, stressiä, polttoaineenkulutusta ja saasteita."
ILMOITUS
Sisärobotiikka oli joka on perustettu 2018: ssä ja äskettäin keräsi 18 miljoonaa dollaria rahoitusta. Tel-Avivin lähellä Israelissa sijaitseva yritys kehittää ja myy autonomisia droneratkaisuja sisätilojen turvallisuuteen, turvallisuuteen ja kunnossapidon valvontaan. Toimitusjohtajalla ja perustajalla Doron Ben-Davidilla on merkittävää kokemusta robotiikasta ja ilmailusta IAI:sta.
Ofir Bar-Levav on liiketoimintajohtaja. Hän selittää, että GPS:n puute on estänyt sisädrooneja paikantumasta rakennuksiin (yleensä GPS-esto tai epätarkka). Lisäksi kätevistä ja tehokkaista telakointi- ja virransyöttöratkaisuista puuttui. Indoor Robotics ratkaisee tämän neljällä drooniin asennetulla kameralla (ylä, alas, vasen, oikea) ja yksinkertaisilla etäisyysantureilla, jotka kartoittavat tarkasti sisätilan ja sen sisällön. Tekoälyjärjestelmä analysoi kameratiedot (kamerat tarjoavat paikannus- ja kartoitustiedot) ja lämpöanturit (myös drooniin asennettuina) mahdollisten turvallisuus- ja huoltoongelmien havaitsemiseksi ja asiakkaan varoittamiseksi. Droonit saavat virtansa kattoon asennetun "telakointilaatan" kautta, mikä säästää arvokasta lattiatilaa ja mahdollistaa tiedonkeruun latauksen aikana. Näiden arkipäiväisten prosessien automatisoinnin taloudelliset edut, joissa ihmistyö on monimutkaista ja kallista rekrytoinnin, säilyttämisen ja koulutuksen kannalta, ovat ilmeisiä. Ilmadroneiden vs. maanpäällisten robottien käytöllä on myös merkittäviä etuja pääoma- ja käyttökustannusten, paremman lattiatilan käytön, vapauden liikkua ilman esteitä ja kameran tiedonkeruun tehokkuuden suhteen. Bar-Levavin mukaan Indoor Roboticsin älykkäiden sisäturvajärjestelmien TAM (Total Addressable Market) on 80 miljardia dollaria vuoteen 2026 mennessä. Tärkeimpiä asiakaspaikkoja ovat nykyään johtavien globaalien yritysten varastot, datakeskukset ja toimistokampukset.
ILMOITUS
Tietokonenäkö mullistaa autonomiapelin – liikeautomaatiossa, turvallisuudessa, älykkäässä rakennuksen valvonnassa, petosten havaitsemisessa ja liikenteen hallinnassa. Puolijohteiden teho ja tekoäly ovat tehokkaita mahdollistajia. Kun tietokoneet hallitsevat tämän uskomattoman aistimodaliteetin skaalautuvalla tavalla, mahdollisuudet ovat loputtomat.
Lähde: https://www.forbes.com/sites/sabbirrangwala/2022/10/04/advances-in-computer-vision-propel-transportation-autonomy/