使用python解析json字段得3種方式實(shí)例

    目錄

    1、運(yùn)用re、json、jsonpath包解析json思路

    (1)re:正則表達(dá)式,通過json得形式對(duì)癥下藥,寫表達(dá)式去解析json;

    (2)json: 通過json中得json.loads()方法,將str類型轉(zhuǎn)為dict類型,運(yùn)用python字典得數(shù)據(jù)結(jié)構(gòu)特點(diǎn)去解析json;

    (3)jsonpath:對(duì)比與json包,jsonpath可以根據(jù)路徑去解析json,比較適合用來解析json中帶“[ ]”得數(shù)據(jù)。

    2、三種方式得json解析案例

    #json數(shù)據(jù)樣式,本文采用帶[]得數(shù)據(jù)樣式{    "version": "version 1.0.12",    "result": {        "pages": 1314,        "data": [            {                "name": "大明",                "IDcard": "440588190001015688",                "address": "廣東省廣州市天河區(qū)正佳廣場99樓520號(hào)",            },            {                "name": "二明",                "IDcard": "440588190012317456",                "address": "廣東省廣州市天河區(qū)天環(huán)廣場88樓520號(hào)",            }        ]    }}

    (1)運(yùn)用re正則表達(dá)式解析json

    import rejsondata={    "version": "23231cimesfedkk",    "result": {        "pages": 1314,        "data": [            {                "name": "大明",                "IDcard": "440588190001015688",                "address": "廣東省廣州市天河區(qū)正佳廣場99樓520號(hào)",            },            {                "name": "二明",                "IDcard": "440588190012317456",                "address": "廣東省廣州市天河區(qū)天環(huán)廣場88樓520號(hào)",            }        ]    }}if __name__ == '__main__':    name_list=re.findall(r"'name': '(w*)'",str(jsondata))    IDcard_list=re.findall(r"'IDcard': '(w{18})'", str(jsondata))#身份證18位數(shù)字和字母組合    address_list=re.findall(r"'address': '(w*)'", str(jsondata))#地址    print(name_list)    print(IDcard_list)    print(address_list)

    運(yùn)行結(jié)果:

    ['大明', '二明']
    ['440588190001015688', '440588190012317456']
    ['廣東省廣州市天河區(qū)正佳廣場99樓520號(hào)', '廣東省廣州市天河區(qū)天環(huán)廣場88樓520號(hào)']

    (2)運(yùn)用字典得數(shù)據(jù)結(jié)構(gòu)性質(zhì)解析json

    import jsonjsondata={"version": "23231cimesfedkk","result": {"pages": 1314,"data": [{"name": "大明","IDcard": "440588190001015688","address": "廣東省廣州市天河區(qū)正佳廣場99樓520號(hào)",},{"name": "二明","IDcard": "440588190012317456","address": "廣東省廣州市天河區(qū)天環(huán)廣場88樓520號(hào)",}]}}if __name__ == '__main__':    # 若傳入得數(shù)據(jù)為str類型需要將它轉(zhuǎn)成dict類型    # result = json.loads(jsondata)    jsondata = jsondata["result"]["data"]    resultdata = jsondata    namelist=[]    idcardlist=[]    addresslist=[]    for data in resultdata:        namelist.append(data['name'])        idcardlist.append(data['IDcard'])        addresslist.append(data['address'])    print(namelist)    print(idcardlist)    print(addresslist)

    運(yùn)行結(jié)果:

    ['大明', '二明']
    ['440588190001015688', '440588190012317456']
    ['廣東省廣州市天河區(qū)正佳廣場99樓520號(hào)', '廣東省廣州市天河區(qū)天環(huán)廣場88樓520號(hào)']

    (3)運(yùn)用jsonpath得路徑解析json

    import jsonpathjsondata={"version": "23231cimesfedkk","result": {"pages": 1314,"data": [{"name": "大明","IDcard": "440588190001015688","address": "廣東省廣州市天河區(qū)正佳廣場99樓520號(hào)",},{"name": "二明","IDcard": "440588190012317456","address": "廣東省廣州市天河區(qū)天環(huán)廣場88樓520號(hào)",}]}}if __name__ == '__main__':    namelist=[]    idcardlist=[]    addresslist=[]    #運(yùn)用jsonpath.jsonpath(字典數(shù)據(jù), 路徑)    namelist=jsonpath.jsonpath(jsondata, '$..name')    idcardlist=jsonpath.jsonpath(jsondata, '$..IDcard')    addresslist=jsonpath.jsonpath(jsondata, '$..address')    print(namelist)    print(idcardlist)    print(addresslist)

    運(yùn)行結(jié)果:

    ['大明', '二明']
    ['440588190001015688', '440588190012317456']
    ['廣東省廣州市天河區(qū)正佳廣場99樓520號(hào)', '廣東省廣州市天河區(qū)天環(huán)廣場88樓520號(hào)']

    3、附錄:re正則表達(dá)式語法

    附:python 處理非標(biāo)準(zhǔn) json 格式字符串

    在寫爬蟲得時(shí)候,會(huì)發(fā)現(xiàn)很多數(shù)據(jù)都是通過 json 格式進(jìn)行傳輸?shù)茫瑯?biāo)準(zhǔn)得 json 我們可以將其轉(zhuǎn)化為 Python 中得數(shù)據(jù)類型,進(jìn)行查詢,但對(duì)于一些類似于 json 但又非標(biāo)準(zhǔn) json 格式得字符,就會(huì)比較頭疼了,這里統(tǒng)計(jì)一些咱遇到得非標(biāo)準(zhǔn)得 json 格式,及相應(yīng)得解析方法。

    字符串中 key 得值沒有被單引號(hào)包裹

    類似于這種字符,看上去格式和 json 很像(眼尖得朋友可能發(fā)現(xiàn)了,這是 qq 得數(shù)據(jù) 嘿嘿),但仔細(xì)觀察會(huì)發(fā)現(xiàn),這其中得 key 沒有被單引號(hào)包裹起來,這就導(dǎo)致了它無法被簡單得解析為字典類型,因?yàn)榻馕龅脮r(shí)候 key 會(huì)被解析成相應(yīng)得變量而非字符,這些變量又都沒有定義,所以會(huì)報(bào)錯(cuò)。

    那怎么辦呢?咱得第一反應(yīng)是利用正則去人為構(gòu)造成標(biāo)準(zhǔn)得格式,不過這個(gè)難度系數(shù)有點(diǎn)大,對(duì)正則得要求挺高,還費(fèi)腦子,明顯不符合咱得風(fēng)格。于是咱就去網(wǎng)上找了一下,有沒有現(xiàn)成得方法,還真有呢:

    使用 demjson

    首先安裝 demjson

    pip install demjson
    s = '{suggestion:[{query:"London",interpretation: 'abc'}]}'dict1 = demjson.decode(s)print(dict1){'suggestion': [{'interpretation': 'abc', 'query': 'London'}]}

    總結(jié)

    到此這篇關(guān)于使用python解析json字段得3種方式得內(nèi)容就介紹到這了,更多相關(guān)python解析json字段內(nèi)容請搜索之家以前得內(nèi)容或繼續(xù)瀏覽下面得相關(guān)內(nèi)容希望大家以后多多支持之家!

    聲明:所有內(nèi)容來自互聯(lián)網(wǎng)搜索結(jié)果,不保證100%準(zhǔn)確性,僅供參考。如若本站內(nèi)容侵犯了原著者的合法權(quán)益,可聯(lián)系我們進(jìn)行處理。
    發(fā)表評(píng)論
    更多 網(wǎng)友評(píng)論1 條評(píng)論)
    暫無評(píng)論

    返回頂部

    主站蜘蛛池模板: 国产精品无码AV一区二区三区| 国模视频一区二区| 在线视频精品一区| 国产美女视频一区| 精品视频一区二区| 亚洲人AV永久一区二区三区久久| 亚洲制服丝袜一区二区三区| 免费一区二区无码视频在线播放| 一区二区3区免费视频| 东京热无码一区二区三区av| 久久国产免费一区二区三区 | 嫩B人妻精品一区二区三区| 国产亚洲欧洲Aⅴ综合一区| 色窝窝无码一区二区三区| 亚洲精品色播一区二区| 免费无码A片一区二三区| 国产成人无码精品一区在线观看| 熟女少妇精品一区二区| 日韩一区二区视频在线观看 | 中文日韩字幕一区在线观看| 激情内射日本一区二区三区| 国产精品一区12p| 日韩A无码AV一区二区三区| 天堂va视频一区二区| 国产伦精品一区二区三区免费迷 | 免费看一区二区三区四区| 中文字幕日本精品一区二区三区| 麻豆视频一区二区三区| 日本在线视频一区| 久久99久久无码毛片一区二区| 久久久久人妻一区精品果冻| 深夜福利一区二区| 中文字幕一区二区三区免费视频 | 国产一区二区三区在线| 男人的天堂精品国产一区| 夜夜精品无码一区二区三区 | 国语对白一区二区三区| 色综合一区二区三区| 亚洲国产精品一区二区三区久久| 亚洲第一区精品日韩在线播放| 中文字幕在线精品视频入口一区|