Programmering

3 Kaggle-alternativer for samarbeidende datavitenskap

Hva er den beste måten å få et godt svar på et tøft spørsmål? Spør en haug med mennesker, og lag en konkurranse ut av det. Det har lenge vært Kaggles tilnærming til datavitenskap: Gjør tøffe oppdrag, som å gjøre deteksjon av lungekreft mer nøyaktig, til bounty-betalende konkurranser, der de beste lagene og de beste algoritmene vinner.

Nå ruller Kaggle inn på Google, og mens alle tegn peker på at det blir holdt som det er for nå, vil det være skakninger om de langsiktige utsiktene for et nettsted med et så hengiven samfunn og en idiosynkratisk tilnærming.

Her er tre andre nettsteder som deler et lignende oppdrag, hvis ikke eksplisitt følges i Kaggles fotspor. (Merk at noen nettsteder, som CrowdAnalytix, kan vurdere aksepterte løsninger i konkurranser som utleieverk og dermed deres eiendom.)

CrowdAI

Et produkt av École Polytechnique Fédérale de Lausanne i Sveits, CrowdAI er en åpen kildekodeplattform for å være vert for åpne datautfordringer og få innsikt i hvordan problemene ble løst. Plattformen er ganske ny, med bare seks utfordringer som hittil er tilbudt, men opplæringsprogrammene fra disse utfordringene er detaljerte og verdifulle, og gir trinnvise metoder for å reprodusere det arbeidet eller lage noe lignende. De eksisterende øvelsene dekker vanlige rammer som Torch eller TensorFlow, så det er et bra sted å skaffe seg praktiske detaljer for å bruke dem.

DrivenData

DrivenData, opprettet av et konsulentfirma som arbeider med profesjonelle dataproblemer, er vert for online utfordringer som varer noen måneder. Hver er fokusert spesielt på presserende problemer overfor hele verden, som å forutsi spredning av sykdommer eller utvinning av Yelp-data for å forbedre restaurantinspeksjonsprosesser. I likhet med Kaggle har DrivenData også et datavitenskapsliste - en funksjon folk er bekymret for kan gå glipp av Kaggle etter oppkjøpet.

CrowdAnalytix

Støttet av investorer fra Accel Partners og SAIF Partners, fokuserer CrowdAnalytix på å være vert for datadrevne problemløsingskonkurranser, i stedet for å dele informasjon som følger av dem. Konkurranser tilbys for å finne løsninger på problemer i kategorier som modellering, visualisering og forskning, og hver har dusør i tusenvis av dollar. Noen tidligere utfordringer inkluderer å forutsi de reelle kostnadene for arbeidstakers erstatningskrav eller forsinkelser fra flyselskapet. Andre konkurranser er imidlertid ikke vert for penger, men for å tilby et konkurransedyktig alternativ for å lære en relatert disiplin, for eksempel R-språket.

$config[zx-auto] not found$config[zx-overlay] not found