Wednesday 8 February 2017

Piste De Régression Linéaire Sklearn Forex

Comment faire une régression linéaire avec le sklearn Introduction La régression linéaire simple est une méthode statistique qui permet de résumer et d'étudier les relations entre deux ou plusieurs variables continues (quantitatives). C'est une bonne idée de commencer à faire une régression linéaire pour l'apprentissage ou lorsque vous commencez à analyser des données, puisque les modèles linéaires sont simples à comprendre. Si un modèle linéaire n'est pas le chemin à parcourir, vous pouvez passer à des modèles plus complexes. Le régression linéaire tente de trouver une relation entre les variables. Scikit-learn est une bibliothèque python qui est utilisée pour l'apprentissage automatique, le traitement des données, la validation croisée et plus encore. Dans ce tutoriel nous allons faire une régression linéaire simple en utilisant cette bibliothèque, en particulier nous allons jouer avec des données générées aléatoirement que nous utiliserons pour prédire un modèle. Nous demandons à l'utilisateur d'avoir un environnement python anaconda déjà installé. Quand utiliser la régression linéaire Lorsque vous pensez qu'il existe une relation entre la variable à analyser (X et Y), comme on le voit à la figure 0. Ce que nous allons tenir est la pente (m) et l'intercepteur y (b), Donc nous allons obtenir une fonction comme: y xm b. Dans ce cas, la combinaison linéaire n'a que x puisque nous utilisons des données 2D, mais le modèle linéaire général où y est le modèle prédit est: Etape 1: Installation de scikit-learn Test que scikit-learn a été correctement installé :: Etape 2: Générer Données linéaires aléatoires Nous allons choisir des valeurs fixes de m et b pour la formule y xm b. Ensuite, avec une erreur aléatoire de 1 générera les points aléatoires. Habituellement, vous ne savez pas à l'avance cette information, nous générons ces données à des fins pédagogiques. Avec ces points nous allons utiliser sklearn pour créer un régression linéaire et vérifier à quel point nous sommes arrivés aux valeurs m et b fixes que nous choisissons. Dans notre code, nous définissons d'abord la fonction f, qui est une fonction linéaire. En particulier cette fonction ajoute - 1 d'erreur aléatoire au résultat, sinon nous allons obtenir une ligne droite. Ensuite, nous générons 300 points au hasard que nous utiliserons pour former un modèle. Si nous traçons le point que nous obtiendrons: Étape 3: Utiliser scikit-apprendre à faire une régression linéaire Maintenant, nous sommes prêts à commencer à utiliser scikit-apprendre à faire une régression linéaire. En utilisant la liste des valeurs, nous allons alimenter la méthode d'ajustement de la régression linéaire. Nous séparons également les données en deux parties: train et test. Avec l'étape 5 nous allons mesurer l'erreur du modèle linéaire entraîné. La sortie doit être similaire à: Étape 4: Plot le résultat Maintenant, nous allons tracer la régression monté: Étape 5: Mesurer l'erreur La sortie doit être similaire à: Comment réparer l'erreur Erreur: ImportError: numpy. core. multiarray a échoué Pour importer essayez de mettre à jour numpy avec: Si vous n'utilisez pas anaconda: Comment réparer ValueError: Arrays trouvés avec des nombres incohérents d'échantillons Vérifiez que les valeurs X de la fonction d'ajustement est une liste de liste de valeurs possibles pour chaque Y. Please enable JavaScript pour voir les commentaires powered by Disqus. sklearn. linearmodel. LinearRegression DEPRECATED: les résidus est déprécié et sera supprimé en 0.19 Obtenir les résidus du modèle ajusté. Retourne le coefficient de détermination R2 de la prédiction. Le coefficient R2 est défini comme (1 - uv), où u est la somme de régression des carrés ((ytrue - ypred) 2).sum () et v est la somme résiduelle des carrés ((ytrue - ytrue. mean () 2).sum (). Le meilleur score possible est 1,0 et il peut être négatif (parce que le modèle peut être arbitrairement pire). Un modèle constant qui prédit toujours la valeur attendue de y, sans tenir compte des caractéristiques d'entrée, obtiendrait un score R2 de 0,0. X . Tableau-like, la forme (nsamples, nfeatures)


No comments:

Post a Comment