51dev.com IT技术开发者社区

51dev.com 技术开发者社区

基于DATAFRAME中元素的读取与修改方法

基于DATAFRAME中元素的读取与修改方法

DATAFRAME中使用iat[1,0]和iloc[0,1]对元素进行修改。a=[("hahaha",1),("lalala",2),("cacaca",6)]b=padas.DataFrame(a)b.iat[1,0]=1.0将位置横竖坐标为1,0的元素改为值为1.0。以上这篇基于DATAFRAME中元素的读取与修改...

pandas Dataframe行列读取的实例

pandas Dataframe行列读取的实例

如下所示:importmatplotlib.pyplotaspltimporttkinterimportnumpyasnpimportpandasaspdfrompandasimportSeries,DataFramedata={‘a‘:[1,2,3],‘c‘:[4,5,6],‘b‘:[7,8,9]}frame=Dat...

python 给DataFrame增加index行名和columns列名的实现方法

python 给DataFrame增加index行名和columns列名的实现方法

在工作中遇到需要对DataFrame加上列名和行名,不然会报错开始的数据是这样的需要的格式是这样的:其实,需要做的就是添加行名和列名,下面开始操作下。#a是DataFrame格式的数据集a.index.name=‘date‘a.columns.name=‘code‘这样就可以修改过来。以上这篇python给DataFr...

python中for用来遍历range函数的方法

python中for用来遍历range函数的方法

栗子:计算斐波那契数列(任一个数都是前两个数之和的数字序列)Python2.7实现代码如下:<strong><span>fibs=[0,1]//初始化定义数列值foriinrange(20)://循环遍历20次fibs.append(fibs[-2]+fibs[-1])printfibs//打印...

删除python pandas.DataFrame 的多重index实例

删除python pandas.DataFrame 的多重index实例

如下dataframe想要删除多层indextop1000[:10]namesexbirthsyearpropyearsex1880F0MaryF706518800.0776431AnnaF260418800.0286182EmmaF200318800.0220133ElizabethF193918800.021309...

python爬虫正则表达式之处理换行符

python爬虫正则表达式之处理换行符

刚开始学python,记录下问题。代码如下:#coding:utf-8importre,urllib2defgetHTML(url):html=urllib2.urlopen(url)html=html.read()returnhtmlif__name__==‘__main__‘:url=‘https://www.ba...

pandas 数据实现行间计算的方法

pandas 数据实现行间计算的方法

如下所示:###方法1:用shift函数,不用通过循环importpandasaspdimportnumpyasnpimportmatplotlibaspltdf=pd.DataFrame(np.random.randn(6,4),index=dates,columns=list(‘ABCD‘))df[‘diff‘]=...

对dataframe进行列相加,行相加的实例

对dataframe进行列相加,行相加的实例

实例如下所示:>>>importpandasaspd>>>df=pd.DataFrame({"x":[‘a‘,‘b‘,‘c‘,‘d‘],"y":[‘aa‘,‘bb‘,‘cc‘,‘dd‘],"z":[‘aaa‘,‘bbb‘,‘ccc‘,‘ddd‘]})>>>dfxyz...

pandas DataFrame实现几列数据合并成为新的一列方法

pandas DataFrame实现几列数据合并成为新的一列方法

问题描述我有一个用于模型训练的DataFrame如下图所示:其中的country、province、city、county四列其实是位置信息的不同层级,应该合成一列用于模型训练方法:parent_teacher_data[‘address‘]=parent_teacher_data[‘country‘]+parent_...

基于python log取对数详解

基于python log取对数详解

log()方法返回x的自然对数,对于x>0。语法以下是log()方法的语法:importmathmath.log(x)注意:此函数是无法直接访问的,所以我们需要导入math模块,然后需要用math的静态对象来调用这个函数。参数x–这是一个数值表达式。返回值此方法返回x的自然对数,对于x>0。另外,可以通过l...

python pandas中对Series数据进行轴向连接的实例

python pandas中对Series数据进行轴向连接的实例

有时候我们想要的数据合并结果是数据的轴向连接,在pandas中这可以通过concat来实现。操作的对象通常是Series。Ipython中的交互代码如下:In[17]:frompandasimportSeries,DataFrameIn[18]:series1=Series(range(2),index=[‘a‘,‘b...

Pandas 合并多个Dataframe(merge,concat)的方法

Pandas 合并多个Dataframe(merge,concat)的方法

在数据处理的时候,尤其在搞大数据竞赛的时候经常会遇到一个问题就是,多个表单的合并问题,比如一个表单有user_id和age这两个字段,另一个表单有user_id和sex这两个字段,要把这两个表合并成只有user_id、age、sex三个字段的表怎么办的,普通的拼接是做不到的,因为user_id每一行之间不是对应的,像拼...

使用pandas对两个dataframe进行join的实例

使用pandas对两个dataframe进行join的实例

需求:两个文件,一个文件为统计报表,里面含有手机号,另一个文件为手机号段归属地,含有手机号码前七位对应的地区。需要对统计报表进行处理,将手机号所在的归属地加入到统计报表中,使用pandas提供的join功能来实现,代码如下:#coding=utf-8frompandasimportSeries,DataFrameimp...

使用python爬取B站千万级数据

使用python爬取B站千万级数据

Python(发音:英[?pa?θ?n],美[?pa?θɑ:n]),是一种面向对象、直译式电脑编程语言,也是一种功能强大的通用型语言,已经具有近二十年的发展历史,成熟且稳定。它包含了一组完善而且容易理解的标准库,能够轻松完成很多常见的任务。它的语法非常简捷和清晰,与其它大多数程序...

pandas带有重复索引操作方法

pandas带有重复索引操作方法

有的时候,可能会遇到表格中出现重复的索引,在操作重复索引的时候可能要注意一些问题。一、判断索引是否重复a、Series索引重复判断s=Series([1,2,3,4,5],index=["a","a","b","b","c"])print(s.index.is_unique)#FalseSeries.index.is_...