5 principals recursos per a la ciència de dades i l’aprenentatge de màquines

Les dades són el nou petroli. I Machine Learning és el foc. Qui controli aquests dos controlarà el món.


No, l’anterior no és una frase pomposa recollida d’una novel·la distòpica.

És la realitat.

El nou ordre mundial tracta de recopilar grans quantitats de dades rellevants i processar-les amb visions actuables, cosa que la raça humana no ha sabut fer a la història. És el tipus de tecnologia que permet un país avançar dels altres i, eventualment, governar el món. Com a resultat, les nacions progressistes del món l’han pres molt seriosament.

Una opció de carrera lucrativa

Intriga internacional a part, la ciència de dades i l’aprenentatge de màquines és un camp nou i una oportunitat increïble. La demanda està fora dels gràfics (per dir-ho poc), i no hi ha prou científics de dades al voltant. Ni tan sols els mediocres.

És com si de sobte haguéssim descobert molts nous planetes habitables i no hi hagi prou gent per traslladar-los. Podria seguir endavant i sonar com un registre batut, però crec que aquesta infografia fa molt millor la feina:

Font: insidebigdata.com

Llavors, veiem que els salaris comencen a 50.000 dòlars + i, per als administradors, poden superar fins a 250.000 dòlars.

I no només això, el 2020 la persona mitjana d’aquest planeta generarà 1,7 MB de dades per segon. Es tracta de més de 3.500 TB de dades al llarg de tota la vida: més dades de les que sabem gestionar fins ara, encara que sigui d’anàlisi. Dir que el futur és brillant seria fer un servei per a aquesta magnífica nova pastura.

És difícil que la ciència de dades i l’aprenentatge automàtic?

Bona pregunta!

Segons la meva experiència, la resposta és “sí” i “no”.

La intel·ligència artificial (i, per extensió, l’aprenentatge automàtic), és el més difícil de fer si teniu la voluntat d’iniciar-vos en investigacions i empènyer el sobre. Per a aquest treball, fins i tot un doctorat. cadascun en informàtica i matemàtiques no és suficient. Però aleshores, la persona mitjana no té l’ambició ni el temps per a aquest exercici.

A l’altre extrem, és el que he anomenat Ciència de dades aplicades i Aprenentatge automàtic.

És a dir, adopteu eines, tècniques i algorismes existents i les apliqueu per resoldre algun problema del món real. Aquesta part requereix dedicació, percepció i pensament creatiu (i coneixement d’alguns conceptes simples de matemàtiques, que s’aprenen ràpidament), però pel que fa a veritables coneixements “tècnics”, és molt més feixuc que el que l’ofici d’un enginyer de programari diu..

En altres paraules, no es tracta d’un passeig marítim, sinó d’un pas relació recompensa a esforç, és una de les millors inversions que hi ha.

Ara que heu endurit la vostra resolució per convertir-se en científic de dades i enginyer en aprenentatge automàtic, comencem a explorar les millors opcions que hi ha.

Curs d’aprenentatge automàtic (Google)

No molta gent n’és conscient, però Google té una extensió, molt pràctica i curs gratuït sobre Aprenentatge Automàtic. Segons l’empresa, és part del seu compromís per avançar en les tecnologies AI / ML i mantenir els coneixements al descobert.

El millor d’aquest curs és que no hi ha requisits previs, però prepareu-vos per passar temps addicional explorant els conceptes d’estadístiques pel vostre compte..

Vull dir, no és necessari, però si teniu antecedents en estadístiques avançades, és possible que les explicacions d’aquest curs no siguin suficients. Una altra captació és que aquest curs introdueix Machine Learning via TensorFlow, que és una implementació de ML desenvolupada per Google. Així, en certa manera, Google té l’objectiu de promoure les seves API per a l’aprenentatge automàtic, però tenint en compte el valor que ofereix aquest curs, no veig com hauria de ser una ensopegada.

Si fos alguna cosa, TensorFlow és una de les maneres fàcils d’entrar en ML i té una popularitat rabiosa (per a una comparació de marcs d’IA, vegeu això).

CS109 Data Science (Universitat de Harvard)

El nom Harvard m’inspira, i també ho fa aquest curs.

Primers aspectes: no és un curs ràpid que ens deixem embrutar i ensenyaríem l’aprenentatge automàtic escrivint un fragment aquí o un script aquí. Aquest curs és un bateig de foc sever que requereix un treball dur i una inversió important de temps.

El curs inclou vídeos gratuïts, codi (allotjat a GitHub) i solucions per a exercicis de laboratori, de manera que pràcticament, no us restarà res si voleu fer-ho.

Públic ideal?

Tu … no estic bromejant.

Vaig dir que treballen professionals amb una educació matemàtica digna, tot i que potser ja no podrien entrar en matemàtiques (els hàbits d’inferència i de prova són el més necessari). Però, una vegada més, advertiu-vos: podríeu pensar que sou bons, però aquest curs tindreu la sensació d’haver endurit les ungles per esmorzar; els problemes de la pràctica són prou difícils per fer-vos plorar, però, potser, exactament, podríeu ser això. estic buscant!

Aprenentatge automàtic (Andrew Ng)

Entra a una barra plena de científics de dades i pregunta qui és Andrew Ng i obtindràs un ritme de vida.

En els cercles de ciències de dades i aprenentatge automàtic, Andrew Ng ha assolit un status diví, gràcies al seu excepcional curs a Coursera – Aprenentatge automàtic.

I si teniu dubte sobre les credencials d’Andrew Ng, ho deixaré parlar per si sol:

Es tracta d’un curs de pagament, ja que forma part del pla de preus de Coursera, però el compromís i la determinació financera no són els únics requisits previs. Aquest és un llarg recorregut, mentre Andrew aprofundeix en les matemàtiques darrere de tot ML i dissecciona els algorismes populars. Però, per sort, és un curs complet i us guiaran pas a pas cap a les profunditats més fosques i us el portarem de nou..

Molt recomanable, principalment perquè avui es converteix en el certificat de finalització d’aquest curs!

Ciències de dades aplicades amb Python

Les especialitzacions de Coursera consisteixen en una sèrie de cursos que tenen com a objectiu portar de zero a competir en un concepte concret. Si busqueu un curs complet, seriós però amè sobre Ciències de dades i aprenentatge de màquines amb Python, no us ho puc recomanar especialització suficient.

Al final del curs, obté un certificat.

Aprenentatge pràctic profund per a codificadors

Aquest curs és una benedicció i és la meva recomanació més preferida d’aquesta llista si sou codificadors.

T’ho tornaré a dir: si ets un codificador.

Això és perquè aquest curs no passa temps per ensenyar-vos els fonaments bàsics de la programació. La descripció del curs ho diu en termes molt clars (l’èmfasi és original):

Suposem que tots els que cursen aquest curs tenen com a mínim, un any d’experiència en codificació. El curs utilitza python com a llengua d’ensenyament, de manera que si encara no coneixeu pitó, suposem que dedicareu el temps a aprendre; per a un codificador experimentat, heu de trobar que el pitó és un llenguatge fàcil d’aprendre..

Així que si ja coneixeu Python (si no) aprendre aquí), o es poden sentir còmodes ràpidament, aquest és el curs perfecte per als pragmàtics que vulguin construir sistemes reals i utilitzables sense preocupar-se massa dels fonaments teòrics dels algorismes..

Fins i tot podria dir-ho que és per a les molèsties impacients (com jo!) Que odien la cerimònia i la monotonia.

I oh, he esmentat que és 100% gratuïta i que té una gran comunitat?!

Conclusió

Phew!

Aquesta va ser una llista difícil de recopilar. No perquè no hi hagi prou fonts bones, sinó perquè hi havia massa!

L’aprenentatge automàtic és un domini que literalment ha esclatat i resol solucions difícils amb problemes amb molta elegància, i així n’hi ha centenars de cursos en línia, gratuïtes i de pagament, la majoria de debò, realment bones. Però també pot ser una font de confusió, i és per això que he intentat reduir-lo a cinc per a diferents tipus d’aprenentatges segons el seu nivell d’experiència.

Espero que us ajudés!

Jeffrey Wilson Administrator
Sorry! The Author has not filled his profile.
follow me
    Like this post? Please share to your friends:
    Adblock
    detector
    map