carVertical

Izvori podataka carVerticala: Kako se stvaraju izvješća o povijesti

Tadas Švenčionis

Tadas Švenčionis

Klijenti i poslovni partneri često nas pitaju: kako carVertical stvara izvješća o povijesti vozila? Odakle dolaze ti podaci?

Ova su pitanja razumljiva – izvješća o povijesti automobila mogu otkriti neke doista neočekivane informacije. Ne tako davno, kupci automobila morali su se osloniti na poštenje prodavača i stručnost svojih mehaničara kako bi kupili pristojan rabljeni automobil.

Pa koliko god željeli imati magične moći, istina je jednostavnija i zanimljivija. U ovom članku objasnit ćemo kako se izrađuju carVertical izvješća.

Trebaš pomoć pri kupovini rabljenog automobila?

Unesi broj šasije i saznaj više o bilo kojem vozilu!

Broj šasije: ključ za otkrivanje povijesti vozila

Većina carVertical izvješća počinje s identifikacijskim brojem vozila (VIN – brojem šasije). Pa što je to i kako nam pomaže?

Gotovo svaki automobil proizveden nakon 1981. godine ima jedinstveni broj šasije od 17 znakova, koji predstavlja nešto popust otiska prsta vozila. Broj šasije koriste razne institucije – poput policije, osiguravajućih društava i servisnih centara – za bilježenje glavnih događaja tijekom životnog vijeka automobila. Prometne nesreće, krađe, provjere kilometraže, promjene vlasništva i još mnogo toga bilježi se ovim brojem.

Budući da živimo u digitalnom dobu, većina tih podataka pohranjuje se u otvorenim i privatnim bazama podataka. Broj šasije naš je ključ za dobivanje tih podataka.

Kako nastaju carVertical izvješća: pogled iza kulisa

Dok je izvješće jednostavno i lako razumljivo, tehnički proces koji stoji iza njega složen je, dinamičan i stalno se razvija. Evo primjera kako neobrađene podatke pretvaramo u jasne i djelotvorne uvide.

1. Korištenje broja šasije za traženje podataka

Kada uneseš broj šasije u aplikaciju ili na web stranicu carVertical, automatski pretražujemo više od 900 izvora podataka u više od 40 zemalja. To uključuje:

  • Agencije za provođenje zakona
  • Baze podataka državne policije
  • Financijske institucije
  • Nacionalne / državne registre
  • Male oglase
  • Neprofitne organizacije

2. Čišćenje podataka i odvajanje onih korisnih

Podaci koje primamo iz različitih izvora obično su neobrađeni i zahtijevaju nekoliko koraka obrade. Ilustrirajmo ovaj postupak primjerom:

Zamisli da primimo švedski dokument za crni Mercedes-Benz GLC 300 s 5.000 skandinavskih milja (50.000 km) na brojaču kilometara, s datumom 12. lipnja 2021. Prije nego što možemo koristiti ove podatke, moramo:

  • Ispraviti sve pogreške/nedosljednosti. Podaci se često ručno unose u sustave, što dovodi do tipfelera ili drugih pogrešaka.
  • Prevesti podatke, ako je potrebno.
  • Razvrstati informacije u relevantne kategorije, kao što su:
    • Datum zapisa: 12. lipnja 2021.
    • Zemlja: Švedska
    • Godina proizvodnje: 2020.
    • Marka: Mercedes-Benz
    • Model: GLC 300
    • Boja: crna
    • Vrijednost na brojaču kilometara: 5.000
    • Jedinica na brojaču kilometara: skandinavske milje

Sada te podatke možemo grupirati s podacima iz drugih pronađenih zapisa i koristiti ih za izradu izvješća.

3. Raspodjela sortiranih podataka u odgovarajuće odjeljke izvješća

Da bismo pobliže pogledali kako podaci postaju dio carVertical izvješća, uzmimo isti crni Mercedes.

Iz gornjeg dokumenta znamo da je imao 50.000 km na brojaču kilometara u vrijeme kada je ova informacija zabilježena.

Razlog zašto „mi“ (tj. sustav carVertical) to znamo je taj što smo analizirali dokument i izdvojili ove 3 informacije – „Vrijednost brojača kilometara: 5000“, „Jedinica brojača kilometara: skandinavske milje“ i „Datum snimanja: 12. lipnja 2021.“

Sada zamislimo da smo pronašli još 2 zapisa podataka o ovom Mercedesu, koji sadrže sljedeće informacije:

  • Dokument #1:
    • Zemlja zapisa: Švedska
    • Brojač kilometara: 187.000 km
    • Datum registracije: 20. listopada 2022.
  • Dokument #2:
    • Zemlja zapisa: Finska
    • Datum tehničkog pregleda: 7. rujna 2023.
    • Brojač kilometara: 105.000 km
    • Emisije CO2: [x g/km]

Ove informacije govore cijelu priču – samo ih moramo sastaviti.

Kako bismo to učinili, grupiramo vrste informacija u odjeljke našeg izvješća. Na primjer, imamo 3 očitanja brojača kilometara i datume kada su uzeti. Oni će se pojaviti u odjeljku izvješća Brojač kilometara. Informacije o tehničkom pregledu nalazit će se u odjeljcima Pravni status i Vremenska crta i slično.

4. Korištenje statističkih modela za generiranje uvida i izvođenje popravaka

Dakle, sada imamo podatke i oni su obrađeni za korištenje u carVertical izvješću. Ali i dalje ima posla koji treba obaviti „ispod haube“ – uglavnom korištenjem statističkih modela i drugih tehnoloških rješenja za rješavanje problema i poboljšanje izvješća.

Bilo bi previše nabrajati sve koristi koje nad pružaju ove tehnologije, ali kao primjer koristimo statističke modele kako bismo korisnicima pružili dodatne uvide (npr. možemo usporediti kilometražu našeg primjera Mercedesa s drugim automobilima istog modela, starosti itd.).

Ovaj proces funkcionira u oba smjera: koristimo se statističkim modelima za poboljšanje trenutnog izvješća, a koristimo podatke iz trenutnog izvješća za poboljšanje naših statističkih modela.

5. Generiranje izvješća

U ovom trenutku, sve informacije koje smo prikupili, očistili, sortirali i poboljšali, koriste se za generiranje carVertical izvješća. Vratimo se našem Mercedesu za posljednji primjer. Evo kako bi mogao izgledati njegov odjeljak Brojač kilometara:

Iako se ovaj crni Mercedes može činiti privlačnim, gornji grafikon trebao bi natjerati svakog potencijalnog kupca da dvaput razmisli!

Iz izvješća korisnici također mogu saznati kako je automobil stigao u Švedsku, prodan drugom vlasniku u Švedskoj i konačno završio u Finskoj. Koristeći statističke modele, također možemo dati raspon cijena za ovaj model automobila, kao i grafikon prosječne kilometraže (iako se potonji ne bi puno promijenio, s obzirom na vraćanje kilometraže!), i još mnogo toga.

Oštećenja, očitanja kilometraže i sve ostalo: koji podaci dolaze iz kojih izvora?

Ne raspravljajući o određenim bazama podataka / izvorima specifičnih informacija u našim izvješćima, možemo pogledati neka opća pravila o tome odakle određene vrste podataka mogu potjecati.

Međutim, prije nego što to učinimo, važno je razumjeti nekoliko stvari:

  • Ista vrsta informacija može doći iz različitih vrsta izvora. Na primjer, podaci o kilometraži (čak i isti podaci) mogu potjecati iz posjeta servisu radi održavanja, policijskog zapisa ili nekog drugog izvora.
  • Od zemlje do zemlje, mnoge stvari se razlikuju. Iste vrste institucija mogu obavljati različite funkcije vođenja evidencije u sustavima, ovisno o zemlji.

Dakle, gdje se mogu pronaći ti zapisi o oštećenjima, očitanja brojača kilometara i druge pojedinosti?

carVertical ima certifikat ISO/IEC 27001:2017

Kao tvrtka koja adi s velikom količinom podataka, sigurnost shvaćamo vrlo ozbiljno. Kako bismo dokazali svoju predanost, carVertical je dobio certifikat ISO/IEC 27001:2017 – globalni standard za informacijsku sigurnost.

Što to znači?

Kako bi dobila certifikat ISO/IEC 27001:2017, tvrtka mora implementirati alate i procedure, štiteći sve primljene, poslane, izrađene, upravljane i korištene verbalne, pisane i elektroničke informacije od svih mogućih prijetnji: vanjskih, unutarnjih, namjernih ili slučajnih.

Ova potvrda znači da smo uveli stroge mjere za zaštitu svih usmenih, pisanih i elektroničkih informacija od bilo kakvih prijetnji – bile one vanjske, unutarnje, slučajne ili namjerne.

Što to znači za tebe? Tvoji osobni podaci, podaci izvješća i financijski detalji zaštićeni su vrhunskim sigurnosnim sustavima. Želiš više pojedinosti? Provjeri našu Politiku informacijske sigurnosti i Sustav upravljanja sigurnošću informacija (ISMS).

Upoznaj carVertical tim za podatke!

carVertical izvješće jednostavno je i lako se čita, ali je mnogo toga potrebno kako bi se došlo do te jednostavnosti. Naš odjel za podatke dobar je odraz toga: carVertical trenutno ima gotovo 200 zaposlenika, a čak 15% njih radi s podacima.

To je značajan broj ljudi koji su dobri u matematici!

Odjel ima 4 specijalizirana tima:

  • Prikupljanje podataka fokusirano je na prikupljanje neobrađenih podataka
  • Inženjering podataka odgovoran je za izgradnju i održavanje naše podatkovne infrastrukture
  • Inženjering strojnog učenja razvija i implementira modele strojnog učenja
  • Analiza podataka analizira podatke tražeći uvide i informirane poslovne odluke

Svaki od ovih timova igra ključnu ulogu u izradi carVertical izvješća – bez njih doslovno ne bismo postojali!

Provjeri broj šasije

Izbjegni skupe probleme provjerom povijesti vozila. Preuzmi izvješće u trenu!

Choose input mode between VIN number and license plate

Često postavljana pitanja

Tadas Švenčionis

Autor članka

Tadas Švenčionis

Tadas je glavni urednik carVerticalova bloga. Kao ljubitelj svega vezanog uz automobile i tehnologiju, on radi na tome da kompleksne teme učini jednostavnima i zanimljivima – jer, što vrijedi dobra priča ako ju nitko ne razumije? Tadas svoje slobodno vrijeme provodi čitajući, igrajući videoigre i dovodeći glazbu koju nitko nije tražio u Vilnius u Litvi.