一、初识正则表达式
正则表达式 是一个特殊的字符序列,一个字符串是否与我们所设定的这样的字符序列,相匹配快速检索文本、实现替换文本的操作
json(xml) 轻量级 web 数据交换格式
import re a='C|C++|Java|C#||Python|Javascript' r= re.findall('Python',a) print(r) if len(r) > 0: print('字符串中包含Python') else: print('No') ['Python'] 字符串中包含Python
二、元字符与普通字符
import re a='C0C++7Java8C#9Python6Javascript' r= re.findall('\d',a) print(r) b='' for x in a: try: int(x) b +=x+',' except : pass print(b)
结果:
['0', '7', '8', '9', '6']
0,7,8,9,6,
'Python' 普通字符 '\d' 元字符
三、字符集
import re #找出中间一个字符不是C 和F的 单词 s = 'abc, acc, adc, aec, afc, ahc' r = re.findall('a[^cf]c', s) #[a-z] [cf] print(r)
结果:
['abc', 'adc', 'aec', 'ahc']
四、概括字符集
#\d 数字 \D 字母 #\w 数字和字母 =[a-zA-Z0-9_] \W #\s 空白字符 \S a='python 11\t11java&678p\nh\rp' r = re.findall('\s', a) print(r)
结果:
[' ', '\t', '\n', '\r']
五、数量词
a='python 1111java&678php' r = re.findall('[a-z]{3,6}', a) print(r)
结果:
['python', 'java', 'php']
六、贪婪与非贪婪
a='python 1111java&678php' r = re.findall('[a-z]{3,6}"color: #ff0000">七、匹配0次1次或者无限多次# * 匹配0次或者无限多次 # + 匹配1次或者无限多次 # "color: #ff0000">八、边界匹配符qq = '12345678' # 4~8 r = re.findall('^\d{4,8}$', qq) print(r) a = '123456789' # 4~8 ^规则$ ^开头 $结尾 e = re.findall('^\d{4,8}$', a) print(e)结果:
['12345678']
[]九、组
# () 组 a = 'pythonpythonpythonpythonpython' # r = re.findall('(python){3}', a) print(r)结果:
['python'] 代表存在一组(pythonpythonpython) 这样的数据
十、匹配模式参数
# I | S 忽略大小写 | 匹配所有字符 lanuage = 'PythonC#\nJavaPHP' r = re.findall('c#.{1}', lanuage,re.I | re.S) print(r)结果:
['C#\n']
十一、re.sub正则替换
搜索替换
def convert(value): matched = value.group() # print(value) <_sre.SRE_Match object; span=(6, 8), match='C#'> return '!!'+matched+'!!' lanuage = 'PythonC#JavaC#PHPC#' # r = re.sub('C#', 'GO', lanuage, 1) 返回结果: PythonGOJavaC#PHPC# # s=lanuage.replace('C#', 'GO') r = re.sub('C#', convert, lanuage) #传入参数 print(r)结果:
Python!!C#!!Java!!C#!!PHP!!C#!!
十二、把函数作为参数传递
def convert(value): matched = value.group() #拿到对象的值 # print(value) <_sre.SRE_Match object; span=(6, 8), match='C#'> if int(matched) >=6 : return '9' else: return '0' lanuage = 'A8C3721D86' r = re.sub('\d', convert, lanuage) print(r) # A9C0900D99十三、search与match函数
s = 'A8C3721D86' # None 从开头开始匹配 假如没有找到相应的匹配结果 返回None 只匹配一次 r = re.match('\d', s) print(r) #None #搜索这个字符串 一旦找到第一个满足匹配的结果就返回 只匹配一次 r1 = re.search('\d', s) print(r1) #<_sre.SRE_Match object; span=(1, 2), match='8'> print(r1.group()) #8 print(r1.span()) # (1, 2) r2 = re.findall('\d', s) print(r2) #['8', '3', '7', '2', '1', '8', '6']十四、group分组
#提取life 和python 之间的值 s = 'life is short,i use python' #None r = re.search('life.*python', s) print(r.group()) #life is short,i use python group(组号) r = re.search('life(.*)python', s) print(r.group(0)) #life is short,i use python group(组号) print(r.group(1)) # is short,i use #group(0) 一种特殊情况 匹配正则表达式完整的结果 r = re.findall('life(.*)python', s) print(r) #[' is short,i use '] s = 'life is short,i use python, i love python' r = re.search('life(.*)python(.*)python', s) print(r.group(0)) # life is short,i use python, i love python print(r.group(1)) # is short,i use print(r.group(2)) # , i love print(r.group(0,1,2)) #('life is short,i use python, i love python', ' is short,i use ', ', i love ') print(r.groups()) # (' is short,i use ', ', i love ')十五、一些关于学习正则的建议
#\d 数字 \D 字母 #\w 数字和字母 =[a-zA-Z0-9_] \W #\s 空白字符 \S # . 匹配除了换行符\n之外其他所有字符 # * 匹配0次或者无限多次 # + 匹配1次或者无限多次 # "color: #ff0000">十六、理解JSONJSON 是一种轻量级的数据交换格式
字符串是JSON的表现形式
符合 JSON 格式的字符串叫做 JSON 字符串
{"name":"qiyue"}
JSON VS XML
优势:
跨语言交换数据
易于阅读
易于解析
网络传输效率高
十七、反序列化
import json # JSON object array json_str = '{"name":"qiyue","age":18}' s = json.loads(json_str) # dict #反序列化 s = json.loads(json_str) #load() 把json 的数据类型 转换为我们自己语言的数据类型 print(type(s)) #<class 'dict'> print(s) #{'name': 'qiyue', 'age': 18} print(s['name']) # qiyue json_str = '[{"name":"qiyue","age":18},{"name":"qiyue","age":18}]' s = json.loads(json_str) print(type(s)) # <class 'list'> print(s) # [{'name': 'qiyue', 'age': 18}, {'name': 'qiyue', 'age': 18}] JSON Python object dict array list string str number int number float true True false False null None十八、序列化
#序列化 为json student = [ {"name":"qiyue","age":18, 'flag':False}, {"name":"python","age":18} ] json_str = json.dumps(student) print(type(json_str)) # <class 'str'> print(json_str) #[{"name": "qiyue", "age": 18, "flag": false}, {"name": "python", "age": 18}]十九、小谈JSON、JSON对象与JSON字符串
JSON 是一种轻量级的数据交换格式
JSON对象 局限于语言
JSON字符串
JSON 有自己的数据类型
虽然它和JavaScript 的数据类型有些相似 但是他们不是一种语言
ECMASCRIPT一个标准 JavaScript ActionScription JSON 实现标准的一种方案
REST 服务
总结
以上所述是小编给大家介绍的Python中的正则表达式与JSON数据交换格式 ,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!
RTX 5090要首发 性能要翻倍!三星展示GDDR7显存
三星在GTC上展示了专为下一代游戏GPU设计的GDDR7内存。
首次推出的GDDR7内存模块密度为16GB,每个模块容量为2GB。其速度预设为32 Gbps(PAM3),但也可以降至28 Gbps,以提高产量和初始阶段的整体性能和成本效益。
据三星表示,GDDR7内存的能效将提高20%,同时工作电压仅为1.1V,低于标准的1.2V。通过采用更新的封装材料和优化的电路设计,使得在高速运行时的发热量降低,GDDR7的热阻比GDDR6降低了70%。
更新动态
- 雨林唱片《赏》新曲+精选集SACD版[ISO][2.3G]
- 罗大佑与OK男女合唱团.1995-再会吧!素兰【音乐工厂】【WAV+CUE】
- 草蜢.1993-宝贝对不起(国)【宝丽金】【WAV+CUE】
- 杨培安.2009-抒·情(EP)【擎天娱乐】【WAV+CUE】
- 周慧敏《EndlessDream》[WAV+CUE]
- 彭芳《纯色角3》2007[WAV+CUE]
- 江志丰2008-今生为你[豪记][WAV+CUE]
- 罗大佑1994《恋曲2000》音乐工厂[WAV+CUE][1G]
- 群星《一首歌一个故事》赵英俊某些作品重唱企划[FLAC分轨][1G]
- 群星《网易云英文歌曲播放量TOP100》[MP3][1G]
- 方大同.2024-梦想家TheDreamer【赋音乐】【FLAC分轨】
- 李慧珍.2007-爱死了【华谊兄弟】【WAV+CUE】
- 王大文.2019-国际太空站【环球】【FLAC分轨】
- 群星《2022超好听的十倍音质网络歌曲(163)》U盘音乐[WAV分轨][1.1G]
- 童丽《啼笑姻缘》头版限量编号24K金碟[低速原抓WAV+CUE][1.1G]