sklearn-pandas


TypeError:不可用类型

我写了一小段代码来使用sklearn进行线性回归。 我创建了一个 列的csv文件 列名为X,Y带有一些数字 ,当我读取文件时,我看到内容被正确读取 如下所示。 但是,当我尝试使用命令datafile :,: 或datafile :, 等引用列时,我收到 不可用类型 错误。 当我尝试使用X作为响应时

scikit-learn sklearn-pandas
如何在sklearn的0.14版本中设置`class_weight`?

我知道,有一个class weight中的 . 版本参数sklearn.ensemble.RandomForestClassifier 。 我无法安装 . 。 如何在 . 版中访问此参数 或者,是否有另一种方法可以处理RandomForestClassifier不平衡标签 y values 我有一

scikit-learn version random-forest sklearn-pandas
使用sklearn和pandas进行决策树的ValueError吗?

我是scikit学习的新手,我刚刚看了文档和其他一些stackoverflow帖子,以构建决策树。 我有一个包含 个属性和 个目标标签的CSV数据集。 如何将其传递到决策树分类器 我当前的代码如下所示: 当我运行代码时,出现以下错误: 为了提供一些背景信息,我的数据集包含 个数据点和 个列。 go

python scikit-learn decision-tree sklearn-pandas
sklearn SVM fit()“ValueError:使用序列设置数组元素”

我正在使用sklearn在我自己的图像集上应用svm。 图像放在数据框中。 我传递给fit函数一个具有 D列表的numpy数组,这些 D列表代表图像,我传递给函数的第二个输入是目标列表 目标是数字 。 我总是得到这个错误 ValueError:设置一个带序列的数组元素 。 错误:

python numpy multidimensional-array svm sklearn-pandas
是否可以从pandas.get_dummies获得功能名称?

我想知道是否可以获取pandas.get dummies的功能名称,以便将其传递给export graphviz。 我正在使用get dummies对sklearn DecisionTreeClassifier的数据集进行编码。 导出树时,我希望节点的输出更易于阅读。 先感谢您 编辑: 这是我要完

python pandas graphviz sklearn-pandas
sklearn线性回归系数具有单值输出

我正在使用数据集查看薪水与大学平均绩点之间的关系。 我正在使用sklearn线性回归模型。 我认为系数应该是截距和coff。 相应功能的值。 但是该模型给出了一个单一的值。

python pandas scikit-learn sklearn-pandas
如何在Python中快速计算大量向量的余弦相似度?

我有一组 万个向量,我需要根据余弦相似性检索前 个最接近的向量。 Scipy和Sklearn有计算余弦距离 相似度 向量的实现,但我需要计算 k X k大小的余弦Sim然后取出前 。 python计算中有任何快速实现吗 根据 Silmathoron建议,这就是我正在做的事情

python vector scipy scikit-learn sklearn-pandas
使用Pandas和Sklearn.Neighbors

我正在尝试使用Python . Pandas Sklearn.neighbors在数据帧上拟合KNN模型。 我已导入数据,将其拆分为训练和测试数据和标签,但当我尝试使用它时,我会收到以下错误。 我对熊猫很新,所以任何帮助都会受到赞赏,谢谢

python pandas scikit-learn python-3.5 sklearn-pandas
熊猫系列的元素操作

我有一个熊猫系列x与值 , 或 。 我希望它有值的monkey , gorilla ,和tarzan取决于值。 我想我应该做些类似的事情 但这不起作用。 我猜这是因为它不能按元素操作。

python pandas sklearn-pandas
ValueError:形状(2,2)和(4,6)不对齐:2(dim 1)!= 4(dim 0)

抱怨这条线: 码: 数据: 数据是csv 标头看起来像:

python scikit-learn pca sklearn-pandas