pandas


将字符串(类别)的数组从pandas数据帧转换为int数组

我正在尝试做一些与上一个问题非常相似的事情,但我遇到了错误。 我有一个包含功能和标签的pandas数据框我需要进行一些转换以将功能和标签变量发送到机器学习对象: 然后我有: 输出控制台首先产生: 我遇到了以下错误: 是否可以将数据框中的类别变量 type 转换为int type 可以取值 sing

python numpy pandas
使用pandas循环数据帧的最有效方法是什么? [重复]

这个问题在这里已有答案: 如何迭代Pandas中的DataFrame中的行 个答案 我希望以顺序方式对数据框中的财务数据执行我自己的复杂操作。 例如,我使用从Yahoo Finance获取的以下MSFT CSV文件: 然后我做以下事情: 这是最有效的方式吗 鉴于对熊猫速度的关注,我认为必须有一些特

python pandas performance dataframe for-loop
Python map()函数输出到Pandas DataFrame中

我利用python的map 函数将参数传递给交易模型并输出结果。 我使用itertools.product来查找两个参数的所有可能组合,然后将组合传递给名为 run 的函数。 函数run返回一个返回的pandas数据帧。 Column标头是两个参数的元组和返回的sharpe比率。 见下文: 我的m

python pandas
Python:Pandas,Dataframe,将1列数据转换为2D数据格式

这是Pandas数据帧我想将 D数据转换为 D数组形式 我如何转换自

python transform dataframe pandas
Pandas DataFrame - 所需索引具有重复值

这是我第一次尝试熊猫。 我想我有一个合理的用例,但我磕磕绊绊。 我想将制表符分隔文件加载到Pandas Dataframe中,然后按符号对其进行分组,并使用TimeStamp列索引的x.axis绘制它。 以下是数据的子集: 注意有关TimeStamp列的两件事 它有重复的值和 间隔是不规则的。 我

python dataframe pandas
如何使用熊猫计算加权移动平均值

我可以用大熊猫计算 使用pandas.stats.moments.rolling mean简单移动平均线SMA 使用pandas.stats.moments.ewma指数移动平均EMA 但是,如何使用熊猫计算维基百科http: en.wikipedia.org wiki Exponential s

python pandas
如何在熊猫中读取固定宽度格式的文本文件

我刚接触熊猫,正在弄清楚如何读取文件。 该文件来自WRDS数据库,是自 年代以来的SP 成分清单。 我检查了文件,无论我如何使用 read csv 将其导入,我仍然无法正确显示数据。 以上输出内容是什么意思 一切都会有所帮助

python pandas
熊猫将数据框转换为元组数组

我已经使用熊猫处理了一些数据,现在我想将批处理保存回数据库。 这要求我将数据帧转换为元组数组,每个元组都对应于数据帧的 行 。 我的DataFrame看起来像: 我想将其转换为元组数组,例如: 关于如何有效执行此操作的任何建议

python pandas
使用pandas将索引列添加到DataFrame

我是一个庞大的熊猫用户,在研究了文档后,我仍然无法找到一种直接的方法来执行以下操作。 我有一个带有pandas.DateRange索引的DataFrame,我想添加一个包含相同DateRange部分值的列。 假设我有 和 我怎样才能获得这样的东西:

python pandas
在熊猫中加入或合并覆盖

我想对具有日期时间索引的数据框执行联接 合并 追加操作。 假设我有df ,我想向其中添加df 。 df 可以具有更少或更多的列,以及重叠的索引。 对于索引匹配的所有行,如果df 与df 具有相同的列,我希望df 的值被df 的值覆盖。 如何获得理想的结果

python pandas