Viis peamist ressurssi andmeteaduses ja masinõppes

Andmed on uus õli. Ja masinõpe on tulekahju. Kes neid kahte kontrollib, see kontrollib ka maailma.


Ei, ülaltoodu pole mingi pompoosne fraas, mis on korjatud düstoopilisest romaanist.

See on reaalsus.

Uus maailmakord seisneb selles, et kogutakse tohutul hulgal asjakohaseid andmeid ja töödeldakse neid praktilisteks teadmisteks – mida inimkond pole ajaloo jooksul suutnud teha. See on selline tehnoloogia, mis võimaldab riigil seda teha saa edasi teistest ja lõpuks valitsevad maailma. Selle tulemusel võtavad maailma edumeelsed rahvad seda väga-väga tõsiselt.

Tulus karjäärivalik

Rahvusvahelised intriigid, andmetöötlus ja masinõpe on uskumatu võimalusega uus kuum valdkond. Nõudlus ei ole edetabelis (pehmelt öeldes) ja selle ümber pole piisavalt andmeteadlasi. Isegi mitte keskpärased.

See on nagu oleksime äkki avastanud palju uusi elatavaid planeete ja pole piisavalt inimesi, kuhu nad sinna kolida. Ma võiksin edasi minna ja kõlada nagu purunenud plaat, kuid ma arvan, et see infograafik teeb seda tööd palju paremini:

Allikas: insidebigdata.com

Nii näeme, et palgad algavad 50 000 dollarist + ja juhid saavad tulistada kaugelt üle 250 000 dollari.

Ja mitte ainult, et aastaks 2020 genereerib keskmine inimene sellel planeedil 1,7 MB andmeid sekundis. See on rohkem kui 3500 TB andmeid kogu eluea jooksul – rohkem andmeid, kui me praegu teada oskame, rääkimata analüüsiks kasutamisest. Öelda, et tulevik on helge, tähendaks sellele suurepärasele uuele karjamaale karuteene.

Kas andmeteadus ja masinõpe on rasked?

Hea küsimus!

Minu kogemuse põhjal on vastus nii “jah” kui “ei”.

Tehisintellekt (ja pikemalt öeldes masinõpe) on kõige raskem teha, kui olete kaldunud uurima ja ümbrikku lükkama. Sellise töö eest saab isegi doktorikraadi igast arvutiteadusest ja matemaatikast ei piisa. Kuid siis pole tavalisel inimesel ambitsiooni ega aega selliseks jälitamiseks.

Teisest küljest nimetaksin rakenduslikke andmeteadusi ja masinõpet.

See tähendab, et võtate olemasolevad tööriistad, tehnikad ja algoritmid ning rakendate neid reaalainete probleemi lahendamiseks. See osa nõuab pühendumist, tajumist ja loovat mõtlemist (ja mõne lihtsa matemaatikakontseptsiooni tundmist, mis õpitakse kiiresti), kuid tõeliste “tehniliste” teadmiste osas on see palju leebem kui see, mida tarkvarainsener nimetab.

Teisisõnu, see ei ole koogitee, vaid mööda teed minna tasu ja pingutuse suhe, on üks parimaid investeeringuid seal.

Nüüd, kui olete tugevdanud oma otsust saada andmeteadlaseks ja masinõppeinseneriks, alustame seal pakutavate parimate võimaluste uurimist.

Masinõppe krahhi kursus (Google)

Mitte paljud inimesed pole sellest teadlikud, kuid Google’il on ulatuslik, väga praktiline ja tasuta masinõppe kursus. Ettevõtte sõnul on see osa nende pühendumusest AI / ML tehnoloogiate edendamisel ja teadmiste hoidmisel avatuna.

Parim selle kursuse juures on see, et puuduvad eeltingimused, kuid kulutage siiski aega, et veeta lisaaega statistikamõistete uurimisel iseseisvalt.

Ma mõtlen, et seda pole vaja, kuid kui täpsema statistika taustal pole null tausta, ei pruugi selle kursuse selgitused olla piisavad. Veel üks saak on see, et see kursus tutvustab masinõpet via TensorFlow, mis on Google’i väljatöötatud ML-i rakendus. Nii et Google soovib oma moel oma masinaõppe API-sid reklaamida, kuid arvestades selle kursuse pakutavat väärtust, ei näe ma, kuidas see peaks komistuskiviks olema.

Kui üldse midagi on, on TensorFlow üks hõlpsamaid viise ML-i sattumiseks ja naudib ülikerget populaarsust (AI-raamistike võrdluseks vaadake seda).

CS109 andmeteadus (Harvardi ülikool)

Nimi Harvard inspireerib aukartust ja nii ka see kursus.

Esiteks: see ei ole kiirlaskmise kursus, kus peate masinõppe ümber käima, kirjutades siia katkendi või skripti. See kursus on raske tuleristimine, mis nõuab rasket tööd ja märkimisväärset ajakulu.

Kursus kaasas tasuta videote, koodiga (hostitud GitHubis) ja laboratoorsete harjutuste lahendustega, nii et teid ei piira praktiliselt miski, kui soovite seda teha.

Ideaalne publik?

Sa… ma ei tee nalja.

Ma ütleksin, et korraliku matemaatikaharidusega töötavad spetsialistid, isegi kui nad ei pruugi matemaatikas enam osa saada (järelduste tegemise ja tõestamise harjumused on kõige vajalikumad asjad). Kuid veelkord, palun hoiatage: võite arvata, et olete tublid, kuid sellel kursusel on tunne, nagu oleksite hommikusöögiks paadunud küüntega – harjutamisprobleemid on piisavalt väljakutsed, et panna teid nutma, kuid siis võib just see olla asi, mida te tunnete ” otsite uuesti!

Masinõpe (Andrew Ng)

Kõndige andmeteadlastega täidetud baari ja küsige, kes on Andrew Ng, ja saate oma elust peksa.

Andmeteaduse ja masinõppe ringides on Andrew Ng saanud tänu jumalakartlikule staatusele tänu erakordsele kursusele Coursera – Masinõpe.

Ja kui te kahtlete Andrew Ngi volikirjas, lasen sellel rääkida enda eest:

See on tasuline kursus, kuna see on osa Coursera hinnakujunduskavast, kuid rahaline pühendumus ja sihikindlus pole ainsad eeltingimused. See on pikk kursus, kuna Andrew sukeldub kõigi asjade ML-i taha sügavale matemaatikasse ja jagab populaarseid algoritme. Kuid õnneks on see täielik kursus ja teid juhendatakse samm-sammult kõige pimedamasse sügavusse ja tuuakse tagasi.

Äärmiselt soovitatav, peamiselt seetõttu, et selle kursuse lõputunnistuse leppimine on muutunud tänapäeval asjaks!

Rakenduslik andmeteadus Pythoniga

Spetsialiseerumised Kursusel koosnevad kursuste seeriast, mille eesmärk on viia teid konkreetse kontseptsiooni valdajalt nullist. Kui otsite täielikku tõsist, kuid samas sõbralikku kursust andmeteaduse ja masinõppe kohta Pythoniga, ei saa ma seda soovitada spetsialiseerumine piisav.

Kursuse lõpus teenite tunnistuse.

Kodeerijate praktiline sügav õppimine

See kursus on õnnistus ja on minu kõige lemmikum soovitus selles loendis, kui olete kooder.

Ma ütleksin seda uuesti: kui sa oled kooder.

Sellepärast, et see kursus ei kuluta aega programmeerimise aluste õpetamisele. Kursuse kirjeldus ütleb seda väga selgelt (rõhuasetus on originaalne):

Eeldame, et kõigil sellel kursusel osalejatel on vähemalt üheaastane kodeerimise kogemus. Kursusel kasutatakse õppekeelena pythonit, nii et kui te veel ei tunne pythonit, eeldame, et kulutate aega õppimiseks – kogenud kodeerija jaoks peaksite leidma, et python on üsna lihtne keel, mida õppida.

Nii et kui te juba Pythonit tunnete (kui mitte, siis mitte õppida siin) või pääseb kiiresti sisse, see on ideaalne kursus praktikutele, kes soovivad ehitada reaalseid, kasutatavaid süsteeme, muretsemata liiga palju algoritmide teoreetiliste aluste pärast.

Ma isegi võiksin öelda, et see on mõeldud kannatamatute mõtlejate (nagu mina!) Jaoks, kes vihkavad tseremooniat ja üksluisust.

Ja oi, kas ma mainisin, et see on 100% tasuta ja sellel on suurepärane kogukond?!

Järeldus

Phew!

See oli üks raske nimekiri, mida koostada. Mitte sellepärast, et poleks olnud piisavalt häid allikaid, vaid sellepärast, et neid oli liiga palju!

Masinõpe on domeen, mis on sõna otseses mõttes plahvatuslikult kasvanud ja lahendab raskeid probleeme tõesti elegantselt ning nii on sadu kursusi veebis, tasuta ja tasulised, enamik neist on tõesti väga head. Kuid see võib tekitada ka segadust, mistõttu olen püüdnud seda erinevat tüüpi õppijatele vastavalt kogemuse tasemele keeta kuni viis..

Loodetavasti see aitas!

Jeffrey Wilson Administrator
Sorry! The Author has not filled his profile.
follow me
    Like this post? Please share to your friends:
    Adblock
    detector
    map