Última pergunta sobre Scikit Learn

1
Responda

A pesquisa de grade não fornece os melhores parâmetros

Ao executar a pesquisa em grade no parâmetro Inverso da força de regularização e no parâmetro de número de vizinhos mais próximos para regressão logística, classificador linear SVM e K de vizinhos mais próximos, os melhores parâmetros obtidos na pesquisa em grade não são realmente os melhores ao verificar manualmente por treinamento no mesmo treinamento conjunto de dados. Código abaixo

machine learning scikit learn python google colaboratory grid search

1
Responda

sklearn.neural_networks.MLPRegressor -incapaz de calcular a pontuação de precisão

Esta é minha primeira postagem no StackOverflow! Estou usando o MLPRegressor para gerar uma previsão de múltiplas saídas de classe binária para o meu problema. Depois de obter minha previsão, arredondo todos os valores usando o numpy.round(), para que possa usar o accuracy_score (já que a pontuação de precisão só funciona para problemas de classificação). Depois disso, tento usar o sklearn.metrics.accuracy_score quando recebo o seguinte erro:

python scikit learn mlp

0
Responda

Usando KNNImputer para imputar valores ponderados por distância coordenada GPS

import numpy as np import pandas as pd new=(-110.5718404,44.4165098) q1=(-110.5,44.25) q2=(-110.5,44.5) q3=(-110.75,44.25) q4=(-110.75,44.5) q1_value=90 q2_value=92 q3_value=99 q4_value=89 def haversine_distance(lat1, lon1, lat2, lon2): r=6371 phi1=np.radians(lat1) phi2=np.radians(lat2) delta_phi=np.radians(lat2 -lat1) delta_lambda=np.radians(lon2 -lon1) a=np.sin(delta_phi/2)**2 + np.cos(phi1) * np.cos(phi2) * np.sin(delta_lambda/2)**2 res=r * (2 * np.arctan2(np.sqrt(a), np.sqrt(1 -a))) return np.round(res, 2) df=pd.DataFrame(data=[[90, 92, 93, 89]], index=None, columns=[q1, q2, q3, q4]) import numpy as np import pandas as pd new=(-110.5718404,44.4165098) q1=(-110.5,44.25) q2=(-110.5,44.5) q3=(-110.75,44.25) q4=(-110.75,44.5) q1_value=90 q2_value=92 q3_value=99 q4_value=89 def haversine_distance(lat1, lon1, lat2, lon2): r=6371 phi1=np.radians(lat1) phi2=np.radians(lat2) delta_phi=np.radians(lat2 -lat1) delta_lambda=np.radians(lon2 -lon1) a=np.sin(delta_phi/2)**2 + np.cos(phi1) * np.cos(phi2) * np.sin(delta_lambda/2)**2 res=r * (2 * np.arctan2(np.sqrt(a), np.sqrt(1 -a))) return np.round(res, 2) df=pd.DataFrame(data=[[90, 92, 93, 89]], index=None, columns=[q1, q2, q3, q4]) importar numpy como np importar pandas como pd novo=(-110.5718404,44.4165098) q1=(-110,5,44,25) q2=(-110,5,44,5) q3=(-110,75,44,25) q4=(-110,75,44,5) q1_value=90 q2_value=92 q3_value=99 q4_value=89 def haversine_distance (lat1, lon1, lat2, lon2): r=6371 phi1=np.radianos (lat1) phi2=np.radianos (lat2) delta_phi=np.radians (lat2 -lat1) delta_lambda=np.radians (lon2 -lon1) a=np.sin (delta_phi/2) ** 2 + np.cos (phi1) * np.cos (phi2) * np.sin (delta_lambda/2) ** 2 res=r * (2 * np.arctan2 (np.sqrt (a), np.sqrt (1 -a))) retornar np.round (res, 2) df=pd.DataFrame (dados=[[90, 92, 93, 89]], índice=Nenhum, colunas=[q1, q2, q3, q4]) Então, eu tenho um dataframe com valores para as coordenadas de um determinado GPS. Se for dada uma nova coordenada (neste caso,"nova", gostaria de usar KNNImputer (acho) para imputar o valor, mas não tenho certeza de como fazer isso neste cenário. Se eu quisesse usar 2 vizinhos mais próximos, conforme determinado por algo como haversine_distance, preciso fazer esse cálculo primeiro para todos os pontos possíveis? Ou há uma maneira de passar essa função para o KNNImputer? Estou imaginando um cenário em que teria centenas de valores para imputar dada uma grande grade de valores .

scikit learn python pandas

1
Responda

É possível o agrupamento do KMeans com dimensões mais altas?

Tenho algumas centenas de arrays 3d com os quais gostaria de fazer algumas análises de cluster com o sklearn.cluster.KMeans fará apenas um array 2D. Cada um dos meus arrays tem o tamanho (56,88,56) e eu tenho 300. quando eu os combino como um array eu obtenho (300,56,88,56). KMeans apresenta o erro ValueError: Found array with dim 4. Estimator expected <=2.. Uma maneira de contornar isso é usar o np.ndarray.flatten() na minha matriz, então minha nova matriz é (275968,) e quando combinados em um array recebo (300,275968) e posso usar o agrupamento KMeans. Existe uma maneira de realizar a análise de agrupamento com um array 4D ou vou acabar com o mesmo resultado ou semelhante ao nivelamento do array para uma análise 2D?

scikit learn python cluster analysis k means numpy

Etiquetas quentes

© 2021   OlaMundo.Org