需要从text特征中提取形如 13.5/10 这样的字符串,再分别提取分子分母。
1)可以利用 str.extract() 方法。
2)利用正则表达式 \d+\.?\d*\/\d+ 进行匹配
3)再利用 .split() 方法提取分子分母

代码:

test.text.tolist()# output
['This is Bella. She hopes her smile made you smile. If not, she is also offering you her favorite monkey. 13.5/10 https://t.co/qjrljjt948',"This is Logan, the Chow who lived. He solemnly swears he's up to lots of good. H*ckin magical af 9.75/10 https://t.co/yBO5wuqaPS","This is Sophie. She's a Jubilant Bush Pupper. Super h*ckin rare. Appears at random just to smile at the locals. 11.27/10 would smile back https://t.co/QFaUiIHxHq",'Here we have uncovered an entire battalion of holiday puppers. Average of 11.26/10 https://t.co/eNm2S6p9BD']
test['rating'] = test['text'].str.extract(r'(\d+\.?\d*\/\d+)', expand=False)# 提取分子
test['rating_numerator'] = test.rating.apply(lambda x: eval(x.split('/')[0]))
# 提取分母
test['rating_denominator_fix'] = test.rating.apply(lambda x: eval(x.split('/')[1]))
# 删除中间量
test.drop(['rating'], axis=1, inplace=True)

pandas 利用 正则表达式 从文本中提取数字相关推荐

  1. python正则表达式提取数字比较好_python正则表达式从字符串中提取数字的思路详解...

    python从字符串中提取数字 使用正则表达式,用法如下: ## 总结 ## ^ 匹配字符串的开始. ## $ 匹配字符串的结尾. ## \b 匹配一个单词的边界. ## \d 匹配任意数字. ## ...

  2. 【R语言】正则表达式 从字符串中提取数字

    R语言 正则表达式 从字符串中提取数字 pattern <- "(?<ID>[0-9]+)" result <- regexpr(pattern= patt ...

  3. Excel如何在混合文本中提取数字

    工作中难免要从一大堆数据中提取数字,下面就给大家介绍一下怎么从混合文本中提取数字. 1.插件法(简单,高效) 1.如下图,混合文本中包含数字.英文.中文,数字有在右边有在左边还有在中间.下面就给大家介 ...

  4. 正则匹配——python用一个正则表达式从字符串中提取数字(包括整数、小数、正负数)

    import re# 从字符串中提取数字 totalCount = '-100,abc2.4-123s,d-1ds-0.234as123.2s1.3bb.24' count = re.findall( ...

  5. pandas 从文本中提取数字(正则表达式)

    需要从text特征中提取形如 13.5/10 这样的字符串,再分别提取分子分母. 1)可以利用 str.extract() 方法. 2)利用正则表达式 \d+.?\d/\d+* 进行匹配 3)再利用 ...

  6. 【Excel提取数字】用5个简单公式从混合文本中提取数字

    大家好,前面的文章中小编分享了使用快捷键[Ctrl+E]技巧完成混合文本提取数字,适合初学者和函数不熟悉的同学. 对于熟悉函数的小伙伴们,还是偏向于公式来提取数字,毕竟有些混合文本用函数公式提取比技巧 ...

  7. WPS表格如何从文本中提取数字

    如下图B列是系统导出的文本,文本中含有一些数字,现在想要将这些数字提取出来. 全选B列数据单元格 点击下图选项(Excel插件,百度即可了解详细的下载安装方法,本文这里不作详细叙述) 勾选数字 点击[ ...

  8. excel 公式 单引号 concat_excel数据提取技巧:从混合文本中提取数字的万能公式...

    编按:哈喽,大家好!有没有能把任何文本中包含的所有数字都提取出来的公式?当然是有的,今天就给大家带来提取数字的万能公式,不管数字在文本中的位置是否有规律,不管文本中数字有多少,它都能把数字提取出来.赶 ...

  9. python numpy np.fromstring()函数(从字符串文本中提取数字,返回一维数组)(爬虫提取数字挺好用的)

    from numpy\core\multiarray.py def fromstring(string, dtype=None, count=-1, sep=''): # real signature ...

最新文章

  1. ADOBE ILLUSTRATOR CS5中文版经典教程 pdf
  2. ARMV7,ARMV8
  3. Android WebView对https无响应
  4. 学校电用计算机控制的,高等学校适用教材:计算机控制技术
  5. Java方法的静态绑定与动态绑定讲解
  6. CCF201612-1 中间数
  7. 15. 深入解析Pod对象(二):使用进阶
  8. html画布实现小球沿直线下落,[面向对象的案例]在canvas画布内实现小球的随机移动...
  9. GDPR或使全球域名whois信息被隐藏
  10. commands moudle on python will replace with subprocess on py3.0
  11. Android9.0 setStereoVolume左右声道流程(二十四)
  12. 瑞利信道,莱斯信道和高斯信道模型
  13. 开源问卷工具LimeSurvey:1:概要与安装
  14. python整数转换成英文表示
  15. 服务器过载保护(下篇)——过载处理新方案
  16. android studio报错Error occurred during initialization of VM Could not reserve enough space
  17. 影视剧中十大经典反派台词!(来自大洋论坛)
  18. JavaWeb-云日志
  19. android app防止锁屏_android 屏幕保持不锁屏的实现方式
  20. 二、操作系统基本原理

热门文章

  1. 三子棋实现(多子棋实现)
  2. 首届“攀升玩创嘉年华”端午江城噶事!
  3. 计算机改变我们生活英语作文,How did computer change our live?(计算机如何改变我们的生活?初中英语作文)...
  4. 普林斯顿微积分(一) 函数、图像和直线
  5. pid控制加热算法,附代码仓库——开源免费
  6. 2014年国人开发的最热门的开源软件TOP 100
  7. Spark基础学习笔记06:搭建Spark On YARN集群
  8. Tailwind Input
  9. Docker swarm 通过 docker-compose 部署应用
  10. spring-上手spring