Comment tirer parti de l'intelligence artificielle / de l'apprentissage automatique pour faire fonctionner un emploi

Comment tirer parti de l'intelligence artificielle / de l'apprentissage automatique pour faire fonctionner un emploi

L'intelligence artificielle est l'un des domaines les plus passionnants et attrayants à pénétrer. Le marché mondial de l'apprentissage automatique (ML) devrait passer de 1,4 milliard de dollars en 2017 à 8,8 milliards de dollars d'ici 2022. L'IA devrait créer 2,3 millions d'emplois connexes d'ici 2020, selon Gartner. Le salaire typique d'un scientifique en apprentissage automatique se situe entre 125 000 $ et 175 000 $. Dans le top dix des entreprises les mieux rémunérées pour les talents en IA, le salaire moyen dépasse facilement 200000 dollars. Certes, il y a de nombreuses raisons de combiner cette entreprise en plein essor.

Dans cet article, nous allons probablement décomposer ce que les emplois en intelligence artificielle impliquent et comment acquérir les compétences requises et briser un peu le battage médiatique.

Explication

Tout d'abord, soyons très clairs sur ce qu'est et n'est pas exactement le fonctionnement / le travail de l'intelligence artificielle. N'hésitez pas à sauter cette partie si vous pensez avoir un accord à ce sujet.

L'intelligence artificielle est un terme remarquablement étendu - il s'agit d'une voie d'accès ambitieuse pour reproduire le comportement et l'apprentissage individuels dans les machines. Comment éviter le battage médiatique?

Parlons d'un élément particulier de l'intelligence artificielle qui est technique et bien rémunéré: l'apprentissage automatique. L'apprentissage automatique est un sous-ensemble de l'intelligence artificielle qui implique l'utilisation de certaines règles et algorithmes pour tenter de généraliser les informations d'un seul ensemble de données à un plus large.

Vous pouvez prendre des données étiquetées classifiées par l'homme et travailler à étendre la logique avec l'apprentissage automatique ou permettre à l'ordinateur de subir des données non étiquetées et de comprendre les choses pour vous. Vous pouvez travailler dans une forme d'apprentissage par renforcement qui s'apparente à l'apprentissage en profondeur: un ensemble spécifique de méthodes d'apprentissage automatique qui utilisent des niveaux d'apprentissage par renforcement pour obtenir le résultat souhaité.

Vous travaillerez avec des pipelines d'informations si vous choisissez de vous lancer dans l'apprentissage automatique - la possibilité de posséder des serveurs pour faire des prédictions et des étiquettes pour de nouveaux ensembles de données en suivant des règles spécifiques à partir d'ensembles de données comparables.

L'apprentissage automatique est un ensemble d'applications de programmation permettant d'utiliser des données et l'apprentissage en profondeur ou l'apprentissage par renforcement en est un sous-ensemble. Bien qu'il existe des modèles programmés avec des règles prédéfinies pour transporter les données et les traiter d'une manière particulière - par exemple, un modèle de régression linéaire qui peut vous informer dans quelle mesure un facteur dépendant est influencé par une variable indépendante (bail déterminé par le nombre de chambres dans un appartement, par exemple) - les approches d'apprentissage en profondeur ont tendance à utiliser des unités semi-structurées pour évaluer les informations à une échelle qui fonctionne un peu comme l'esprit humain.

La distinction importante est que l'apprentissage en profondeur fonctionnera à travers plusieurs couches de rétroaction. Une version d'apprentissage en profondeur de type réseau neuronal se corrigera et s'optimisera automatiquement à la suite d'un résultat spécifique, s'accordant pour que sa sortie corresponde à son entrée via l'auto-modification des poids dans la conception.

Ceci est peut-être le mieux illustré avec le modèle d'apprentissage en profondeur le plus simple: celui de la perception, illustré ci-dessus. Dans ce cas, à partir d'un ensemble d'entrées, la couche de calculs cachés effectuée entre l'entrée et la sortie s'auto-modifie jusqu'à ce qu'elle arrive à la sortie souhaitée.

Pourquoi est-ce important? Il constitue la base de toutes sortes d'innovations fascinantes en matière d'intelligence artificielle dont vous avez entendu parler, des voitures autonomes à la reconnaissance vidéo / image. En créant des modèles de plus en plus efficaces qui aident les machines à gérer la complexité des modèles de données qui pourraient s'étendre à des milliers de milliards de possibilités, l'humanité peut bénéficier du traitement automatisé de données toujours plus volumineuses - en obtenant des conseils plus riches sur des ensembles de données qui pourraient devenir de plus en plus grands. Ces informations peuvent permettre à un réseau social tel que Facebook de classer automatiquement les images sur son réseau, ou permettre à quelqu'un de faire correspondre les modèles et de prédire votre comportement en fonction de votre historique.

Cependant, malgré tout le battage médiatique, les approches d'apprentissage en profondeur sont loin de la façon dont les scientifiques pensent que le cerveau humain fonctionne réellement.

Prenons du recul et définissons tous ces termes afin de comprendre précisément à quoi nous nous référons:

La science des données implique l'utilisation de statistiques et d'un concept pour traiter des ensembles de données massifs afin que vous puissiez trouver une réponse ou une prédiction métier en fonction de l'ensemble de données sous-jacent.

L'intelligence artificielle est la grande aspiration des machines à attribuer un raisonnement et un apprentissage de type humain. Il s'agit en grande partie d'une théorie à ce stade, plutôt que de quelque chose de pratique et d'implémentable.

L'apprentissage automatique est un moyen efficace de créer des modèles prédictifs qui apprennent sans avoir besoin d'être spécifiquement conçus pour le faire, un sous-ensemble exploitable de l'intelligence artificielle. Vous pouvez envisager des modèles d'apprentissage automatique depuis des fonctions objectives semi-structurées, dans lesquelles un scientifique des données entraînera un modèle pour un certain résultat, sans avoir à brancher explicitement toutes les variables et interactions requises. Le modèle comprend qu'il tente de minimiser un certain nombre d'erreurs et corrige en conséquence.

L'apprentissage en profondeur est vraiment un sous-ensemble de l'apprentissage automatique et se réfère en particulier à des modèles tels que les réseaux de neurones convolutifs qui réconcilient un signal d'entrée et de sortie avec des couches cachées compactes qui effectuent des niveaux de calculs auto-corrigés afin d'obtenir le résultat souhaité. En pratique, en production, la quantité de couches et de calculs effectués est exponentiellement significative.

Il y a deux divisions fondamentales ici lorsque vous travaillez avec des ensembles de données et l' intelligence artificielle / l'apprentissage automatique :

Les scientifiques des données , qui aident à adapter la logique d'entreprise de ces modèles en cours de création. Fondamentalement, les scientifiques des données aident à transmettre les résultats des unités d'information aux décideurs commerciaux et ils aident à personnaliser et à ajuster les modèles qui aident les entreprises à poser les questions appropriées de leurs informations.

Les ingénieurs en apprentissage automatique créent la plomberie d'informations qui permet aux scientifiques des données de travailler et de traiter avec d'énormes quantités de données qui se mettent à jour en permanence. En pratique, ils sont responsables de nourrir les versions caractérisées par les scientifiques de l'information en utilisant les données qu'ils doivent bien réaliser, et ils sont souvent chargés de transporter des modèles de science des données théoriques et de les aider à les faire évoluer vers des modèles de production capables de gérer les chaque jour des organisations qui génèrent des téraoctets d'informations.

Décomposons-le plus précisément, mais à titre indicatif, même lorsque les deux rôles généraux partagent quelques chevauchements, un scientifique des données travaillera fréquemment avec la théorie soutenant la science des données de l'intelligence artificielle, tandis que les ingénieurs en apprentissage automatique exécuteront des modèles. en pratique. Les scientifiques des données ont tendance à obtenir une base théorique plus solide à partir de l'apprentissage automatique, des données et des mathématiques, tandis que les ingénieurs en apprentissage automatique possèdent généralement une formation en génie logiciel plus puissante.

Vous devrez probablement assumer ces rôles généraux si vous êtes susceptible d'utiliser des versions d'intelligence artificielle.

De nombreuses personnes remettent en question les perspectives à long terme du travail en intelligence artificielle ou en apprentissage automatique. Après tout, ce travail ne sera-t-il pas automatique avec tout ce que l'IA automatisera probablement? C'est une question valable, mais pour l'instant, il est important de prendre en compte l'intelligence artificielle exactement dans la même veine que les révolutions industrielles du passé: une chose qui permet aux individus d'acquérir de nouvelles capacités et de créer de toutes nouvelles économies. Les guichets automatiques sont corrélés à une augmentation des guichets bancaires.

Pourtant, les guichets automatiques peuvent être responsables du chômage structurel de longue durée. Le futur proche, comme toujours, est sombre. Pourtant, nous pourrions apprendre de l'histoire des guichets automatiques que l'automatisation n'implique pas nécessairement la perte d'emplois, même si elle suggère certainement que les nouvelles technologies peuvent renverser des vérités établies.

Rémunération et rôles

Les scientifiques des données présentent ici un fossé important dans la définition catégorielle: les analystes d'informations relèvent également de leur compétence. La principale différence est que les analystes d'information se tournent davantage vers les données de communication et effectuent des requêtes ponctuelles sur des modèles de données basés, qui ont tendance à être caractérisés par les scientifiques des données. Cet article approfondit le fossé entre les fonctions d'analyste de données et de scientifique de l'information.

L'écart peut être assez important. Aux États-Unis, le salaire typique des analystes de données est d'environ 60 000 $. Le data scientist typique gagnera environ 30 000 $ de plus par an.

Pendant ce temps, les ingénieurs de données gagneront même en moyenne environ 90 000 dollars par an, ce qui est très similaire à leurs pairs en sciences de l'information. Mais les ingénieurs se sont concentrés en particulier sur la mise en œuvre de l'apprentissage automatique pour obtenir plus, dépassant facilement 100000 USD par an, et dans ses niveaux supérieurs, une moyenne de 200000 USD par an parmi les entreprises les mieux rémunérées. Des noms bien connus dans le domaine de l'IA recevront parfois des millions de dollars de compensation en espèces et d'actions, bien qu'ils aient tendance à être des praticiens de l'IA qui effectuent des travaux et des recherches de pointe dans les principales universités ou laboratoires du monde entier.

De manière générale, si vous souhaitez développer votre carrière dans l'intelligence artificielle, vous pouvez commencer à utiliser une formation en développement logiciel et adopter le concept d'apprentissage automatique, ou vous pouvez commencer avec le concept d'apprentissage automatique et les compétences de communication et reprendre progressivement la programmation. compétences pour travailler dans l'apprentissage automatique.

Compétences requises

Pour travailler avec l'intelligence artificielle / l'apprentissage automatique, vous avez généralement besoin de quatre classes de compétences:

Le génie logiciel s'efforce de mettre en œuvre des modèles en formation. Vous utiliserez souvent des programmes tels que Python, Pandas, Scikit-Learn, TensorFlow et Spark. La capacité de travailler efficacement dans cet ensemble d'outils permettra de vérifier votre éligibilité à la procédure, de «se débattre», de nettoyer et de gérer vos données afin que vous puissiez les utiliser afin de traiter les grandes quantités d'informations requises dans une version de production.

La compréhension du concept d'apprentissage automatique pour savoir quel modèle mettre en œuvre et pourquoi, ainsi que les inconvénients ou avantages de l'application de certaines approches à certains problèmes de données.

La capacité d'utiliser l'inférence statistique pour évaluer rapidement si un modèle fonctionne.

Connaissance au niveau du domaine et capacité à communiquer des informations provenant des informations aux parties prenantes de l'entreprise. Il est important non seulement d'avoir la capacité d'obtenir des informations à partir des données, mais aussi d'avoir la capacité de transmettre les bonnes réponses aux unités au niveau de l'entreprise afin que vous puissiez contribuer à obtenir des réponses.

Dans la pratique, les ingénieurs en apprentissage automatique s'appuieront davantage sur leurs compétences en ingénierie d'applications, tandis que les scientifiques de l'information s'appuieront davantage sur leurs connaissances de la théorie de l'apprentissage automatique et de l'inférence statistique, ainsi que sur la capacité de transmettre ces informations.