Google govori o važnosti otvorenog koda i otvorenih podataka u nedavnom postu na blogu

Teh / Google govori o važnosti otvorenog koda i otvorenih podataka u nedavnom postu na blogu 3 minute čitanja

Google



Google je kao tvrtka oduvijek podržavao softver i podatke otvorenog koda, barem na njihovom stajalištu. Sad je to gotovo trend kod velikih tvrtki jer su i Google i Microsoft dali značajan doprinos sceni otvorenog koda. “ Google je također glavni suradnik softvera otvorenog koda. Ključni primjeri toga uključuju Android , naš operativni sustav za pametne telefone, Krom , baza koda za naš preglednik Chrome (sada također pokrećući mnoge konkurente ) i TensorFlow , naš sustav strojnog učenja. Googleovo izdanje Namjesnici zauvijek promijenio hosting u oblaku i omogućio inovacije i konkurenciju u industriji oblaka. Google je također najveći suradnik otvorenog koda za GitHub , zajedničko spremište za razvoj softvera. 2017. Googleovi su korisnici samo na GitHubu napravili više od 250 000 izmjena na desetke tisuća projekata. '

U većini slučajeva zapravo se ne radi o velikodušnosti, već više o tome da se koristi besplatnim razvojem, a zatim zaraditi na širokom usvajanju. Bez obzira na to, ovi su doprinosi pomogli tisućama istraživača i usmjerili su razvoj softvera na jedinstven način, što bi trebalo slaviti. Google je u nedavnom blogu istaknuo njihov doprinos otvorenim podacima i softveru otvorenog koda.



Pojavom praćenja u stvarnom vremenu i razvojem automobila bez vozača provodi se mnoga istraživanja računalnog vida, a Google je jedna od tvrtki na čelu Visual Tech-a.



Naša predanost otvorenim izvorima i otvorenim podacima dovela nas je do toga da skupove podataka, usluge i softver dijelimo sa svima. Na primjer, Google je objavio Otvorite skup podataka Images od 36,5 milijuna slika koje sadrže gotovo 20 000 kategorija objekata obilježenih ljudima. Pomoću ovih podataka istraživači računalnog vida mogu osposobiti sustave za prepoznavanje slike. Slično tome, milijuni komentiranih videozapisa u YouTube-8M Zbirka se može koristiti za treniranje prepoznavanja videozapisa.



- Varijantna stvar

Glavni ekonomist, Google

Google također sjedi na puno podataka koji mogu pomoći NLP istraživanju i pomoći računalima da bolje razumiju ljudski govor. U postu na blogu Google je istaknuo dijeljenje ključne baze podataka rekavši „ Što se tiče obrade jezika, podijelili smo Prirodna pitanja baza podataka koja sadrži 307.373 pitanja i odgovore generirane od strane čovjeka. Također smo stavili na raspolaganje Triljunski korpus riječi , koji se temelji na riječima koje se koriste na javnim web stranicama, i Ngram Viewer , koji se može koristiti za istraživanje više od 25 milijuna knjiga u Google Knjige . Ove kolekcije mogu se koristiti za statistički strojni prijevod , prepoznavanje govora, korekcija pravopisa , otkrivanje entiteta, izdvajanje informacija i istraživanje drugih jezika. '



Tražilica je jedna od Googleovih glavnih tvrtki, koja svake sekunde dobiva preko 63 000 upita. Ti su podaci vrlo važni za tvrtku i Google ih analizira za ciljano oglašavanje. Ipak, neki uvidi u ukupne podatke objavljeni su na Googleovom portalu trendova.

' Google također nudi Google trendovi , besplatna usluga koja omogućava svima da vide i preuzmu skupne aktivnosti pretraživanja od 2004. za Google pretraživanje, Pretraživanje slika, Pretraživanje vijesti, Shopping i YouTube. Informacije o zemljama, regijama, metro područjima i gradovima možete dobiti na mjesečnoj, tjednoj, dnevnoj, pa čak i satnoj osnovi. Podaci o trendovima naširoko koriste istraživači u područjima koja su različita poput medicine i ekonomije. Prema Google Scholaru postoje više od 21 000 istraživačkih radova koji kao izvor podataka navode Trends. '

Zašto raditi na projektima otvorenog koda?

O ovome sam kratko razgovarao na početku članka. Novi softver može implementirati sjajnu ideju i inovirati prostor, ali to ne sprječava druge da implementiraju slične ideje i onda rade na poboljšanju. Mnoge su tvrtke to naučile na teži način, na primjer, Windows Phone. Kao što znamo, to je bio gromoglasan neuspjeh iz puno razloga, ali zato što je bilo zatvoreno okruženje i kontroliranje licenci bilo je velik dio toga. Hardoop i HDFS bile su otvorene verzije MapReducea koje je izradio Google i tvrtka je rano naučila važnost otvorenog koda. Rezimirajući, odluka da se IP otvori otvoreni izvor je strateška.

Google se u svom postu na blogu upušta u nekoliko drugih razloga, navodeći ' Prvo i najvažnije, naša je primarna misija 'organizirati svjetske informacije i učiniti ih univerzalno dostupnima i korisnima'. Svakako je jedan očit način da se informacije učine univerzalno dostupnima i korisnima njihovo davanje ! '

Također govore o tome zašto ne mogu objaviti neke stvari navodeći ' Naravno, ne možemo objaviti sve podatke koje koristimo u svom poslu. Moramo zaštititi privatnost korisnika, zadržati povjerljivost za poslovne korisnike i zaštititi Googleovo vlastito intelektualno vlasništvo. No, podložno takvim razmatranjima, općenito nastojimo učiniti naše podatke što univerzalnije dostupnima i korisnima. '

Oznake google