目錄
- 1、運(yùn)用re、json、jsonpath包解析json思路
- 2、三種方式得json解析案例
- (1)運(yùn)用re正則表達(dá)式解析json
- (2)運(yùn)用字典得數(shù)據(jù)結(jié)構(gòu)性質(zhì)解析json
- (3)運(yùn)用jsonpath得路徑解析json
- 3、附錄:re正則表達(dá)式語法
- 附:python 處理非標(biāo)準(zhǔn) json 格式字符串
- 總結(jié)
1、運(yùn)用re、json、jsonpath包解析json思路
(1)re:正則表達(dá)式,通過json得形式對(duì)癥下藥,寫表達(dá)式去解析json;
(2)json: 通過json中得json.loads()方法,將str類型轉(zhuǎn)為dict類型,運(yùn)用python字典得數(shù)據(jù)結(jié)構(gòu)特點(diǎn)去解析json;
(3)jsonpath:對(duì)比與json包,jsonpath可以根據(jù)路徑去解析json,比較適合用來解析json中帶“[ ]”得數(shù)據(jù)。
2、三種方式得json解析案例
#json數(shù)據(jù)樣式,本文采用帶[]得數(shù)據(jù)樣式{ "version": "version 1.0.12", "result": { "pages": 1314, "data": [ { "name": "大明", "IDcard": "440588190001015688", "address": "廣東省廣州市天河區(qū)正佳廣場99樓520號(hào)", }, { "name": "二明", "IDcard": "440588190012317456", "address": "廣東省廣州市天河區(qū)天環(huán)廣場88樓520號(hào)", } ] }}
(1)運(yùn)用re正則表達(dá)式解析json
import rejsondata={ "version": "23231cimesfedkk", "result": { "pages": 1314, "data": [ { "name": "大明", "IDcard": "440588190001015688", "address": "廣東省廣州市天河區(qū)正佳廣場99樓520號(hào)", }, { "name": "二明", "IDcard": "440588190012317456", "address": "廣東省廣州市天河區(qū)天環(huán)廣場88樓520號(hào)", } ] }}if __name__ == '__main__': name_list=re.findall(r"'name': '(w*)'",str(jsondata)) IDcard_list=re.findall(r"'IDcard': '(w{18})'", str(jsondata))#身份證18位數(shù)字和字母組合 address_list=re.findall(r"'address': '(w*)'", str(jsondata))#地址 print(name_list) print(IDcard_list) print(address_list)
運(yùn)行結(jié)果:
['大明', '二明']
['440588190001015688', '440588190012317456']
['廣東省廣州市天河區(qū)正佳廣場99樓520號(hào)', '廣東省廣州市天河區(qū)天環(huán)廣場88樓520號(hào)']
(2)運(yùn)用字典得數(shù)據(jù)結(jié)構(gòu)性質(zhì)解析json
import jsonjsondata={"version": "23231cimesfedkk","result": {"pages": 1314,"data": [{"name": "大明","IDcard": "440588190001015688","address": "廣東省廣州市天河區(qū)正佳廣場99樓520號(hào)",},{"name": "二明","IDcard": "440588190012317456","address": "廣東省廣州市天河區(qū)天環(huán)廣場88樓520號(hào)",}]}}if __name__ == '__main__': # 若傳入得數(shù)據(jù)為str類型需要將它轉(zhuǎn)成dict類型 # result = json.loads(jsondata) jsondata = jsondata["result"]["data"] resultdata = jsondata namelist=[] idcardlist=[] addresslist=[] for data in resultdata: namelist.append(data['name']) idcardlist.append(data['IDcard']) addresslist.append(data['address']) print(namelist) print(idcardlist) print(addresslist)
運(yùn)行結(jié)果:
['大明', '二明']
['440588190001015688', '440588190012317456']
['廣東省廣州市天河區(qū)正佳廣場99樓520號(hào)', '廣東省廣州市天河區(qū)天環(huán)廣場88樓520號(hào)']
(3)運(yùn)用jsonpath得路徑解析json
import jsonpathjsondata={"version": "23231cimesfedkk","result": {"pages": 1314,"data": [{"name": "大明","IDcard": "440588190001015688","address": "廣東省廣州市天河區(qū)正佳廣場99樓520號(hào)",},{"name": "二明","IDcard": "440588190012317456","address": "廣東省廣州市天河區(qū)天環(huán)廣場88樓520號(hào)",}]}}if __name__ == '__main__': namelist=[] idcardlist=[] addresslist=[] #運(yùn)用jsonpath.jsonpath(字典數(shù)據(jù), 路徑) namelist=jsonpath.jsonpath(jsondata, '$..name') idcardlist=jsonpath.jsonpath(jsondata, '$..IDcard') addresslist=jsonpath.jsonpath(jsondata, '$..address') print(namelist) print(idcardlist) print(addresslist)
運(yùn)行結(jié)果:
['大明', '二明']
['440588190001015688', '440588190012317456']
['廣東省廣州市天河區(qū)正佳廣場99樓520號(hào)', '廣東省廣州市天河區(qū)天環(huán)廣場88樓520號(hào)']
3、附錄:re正則表達(dá)式語法
附:python 處理非標(biāo)準(zhǔn) json 格式字符串
在寫爬蟲得時(shí)候,會(huì)發(fā)現(xiàn)很多數(shù)據(jù)都是通過 json 格式進(jìn)行傳輸?shù)茫瑯?biāo)準(zhǔn)得 json 我們可以將其轉(zhuǎn)化為 Python 中得數(shù)據(jù)類型,進(jìn)行查詢,但對(duì)于一些類似于 json 但又非標(biāo)準(zhǔn) json 格式得字符,就會(huì)比較頭疼了,這里統(tǒng)計(jì)一些咱遇到得非標(biāo)準(zhǔn)得 json 格式,及相應(yīng)得解析方法。
字符串中 key 得值沒有被單引號(hào)包裹
類似于這種字符,看上去格式和 json 很像(眼尖得朋友可能發(fā)現(xiàn)了,這是 qq 得數(shù)據(jù) 嘿嘿),但仔細(xì)觀察會(huì)發(fā)現(xiàn),這其中得 key 沒有被單引號(hào)包裹起來,這就導(dǎo)致了它無法被簡單得解析為字典類型,因?yàn)榻馕龅脮r(shí)候 key 會(huì)被解析成相應(yīng)得變量而非字符,這些變量又都沒有定義,所以會(huì)報(bào)錯(cuò)。
那怎么辦呢?咱得第一反應(yīng)是利用正則去人為構(gòu)造成標(biāo)準(zhǔn)得格式,不過這個(gè)難度系數(shù)有點(diǎn)大,對(duì)正則得要求挺高,還費(fèi)腦子,明顯不符合咱得風(fēng)格。于是咱就去網(wǎng)上找了一下,有沒有現(xiàn)成得方法,還真有呢:
使用 demjson
首先安裝 demjson
pip install demjson
s = '{suggestion:[{query:"London",interpretation: 'abc'}]}'dict1 = demjson.decode(s)print(dict1){'suggestion': [{'interpretation': 'abc', 'query': 'London'}]}
總結(jié)
到此這篇關(guān)于使用python解析json字段得3種方式得內(nèi)容就介紹到這了,更多相關(guān)python解析json字段內(nèi)容請搜索之家以前得內(nèi)容或繼續(xù)瀏覽下面得相關(guān)內(nèi)容希望大家以后多多支持之家!