中文url编码

最新推荐文章于 2024-05-08 14:33:43 发布

转载最新推荐文章于 2024-05-08 14:33:43 发布 · 5.6k 阅读

标签

#url #import #google #百度 #c

收录于

Python编程同时被 2 个专栏收录

8 篇文章

订阅专栏

网络技术

4 篇文章

订阅专栏

本文介绍了如何使用Python的urllib库进行URL编码与解码操作，包括不同编码方式间的转换，如从UTF-8到GBK，并提供了具体的代码示例。

>>> import urllib
>>> data = '杭州'
>>> print data
杭州
>>> data
'/xe6/x9d/xad/xe5/xb7/x9e'
>>> urllib.quote (data)
'%E6%9D%AD%E5%B7%9E'

那我们想转回去呢？

>>> urllib.unquote('%E6%9D%AD%E5%B7%9E')
'/xe6/x9d/xad/xe5/xb7/x9e'
>>> print urllib.unquote ('%E6%9D%AD%E5%B7%9E')
杭州

细心的同学会发现贴吧url中出现的是%C0%F6%BD%AD，而非'%E4%B8%BD%E6%B1%9F'，其实是编码问题。百度的是gbk，其他的一般网站比如google就是utf8的。所以可以用下列语句实现。

>>> import sys,urllib
>>> s = '杭州'
>>> urllib.quote(s.decode(sys.stdin.encoding).encode('gbk'))
%BA%BC%D6%DD
>>> urllib.quote(s.decode(sys.stdin.encoding).encode('utf8'))
'%E6%9D%AD%E5%B7%9E'

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

mwsong

关注关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

python实现中文转换url编码的方法

09-21

主要介绍了python实现中文转换url编码的方法,结合实例形式分析了Python针对中文的gbk与utf-8编码转换的相关技巧,具有一定参考借鉴价值,需要的朋友可以参考下

Python使汉字转换成url可识别的编码

qq_33267306的博客

12-02

4829

将汉字转换成url可识别的编码，在爬虫时可根据输入的汉字，转换成url可识别的链接，如‘新能源’转换后是‘%E6%96%B0%E8%83%BD%E6%BA%90’；‘爬虫工程师’转换后为%E7%88%AC%E8%99%AB%E5%B7%A5%E7%A8%8B%E5%B8%88；以及将转换后的编码反转换为汉字，代码如下： import urllib t = '爬虫工程师' s = urllib.parse.quote(t) #将汉字转换成url可识别的 f = urllib.parse.unquot

参与评论您还未登录，请先登录后发表或查看评论

【URL编码】python将中文编码成URL编码格式

weixin_43941438的博客

05-08

1717

%E4%B8%AD%E6%96%87” 是使用UTF-8编码的中文字符“中文”的URL编码（也称为百分号编码）。在这种编码方式中，每个中文字符都被编码成一个由百分号和两位十六进制数字组成的序列。UTF-8编码是一种可变长度的编码方式，它可以将每个Unicode字符编码为1到4个字节。对于基本的多语言平面（BMP）内的字符，包括所有的常用汉字，UTF-8使用3个字节来表示。执行这段代码，将得到编码后的字符串。“中文"会被编码为”%E4%B8%AD%E6%96%87"。在Python中，可以使用。

Python实现中文转换URL编码的方法

DevScript的博客

10-03

815

在上面的示例中，我们导入了urllib.parse模块，并定义了一个名为chinese_to_url_encoding()的函数。该函数接受一个包含中文字符的文本作为输入，并使用urllib.parse.quote()函数对文本进行URL编码操作。最后，函数返回编码后的文本。在上面的示例中，我们导入了requests库，并定义了一个名为chinese_to_url_encoding()的函数。对于包含中文字符的URL，需要进行中文转换URL编码，以确保其在互联网传输过程中的正确性和可靠性。

URL地址中汉字的编码转换(Python)

乐说数据博客

10-01

1250

Python3 编码解码示例 """ utf8 编码""" from urllib.request import quote, unquote url1 = "https://www.baidu.com/s?wd=机器学习" # utf8编码，指定安全字符 ret1 = quote(url1, safe=";/?:@&=+$,", encoding="utf-8") print(ret1) """gbk编码""" from urllib.request import quote, unquot

Python学习笔记15：URL中的中文编码转换

九天翔龙的技术博客

12-26

1410

在做爬虫的时候，有时候需要爬写中文的内容。但是中文字符在某些场合下会转为 %xx 形式的 URL 字符。比如： %E7%BE%8E%E5%A5%B3 以上编码表示“美女”。 Python3 的urllib 库，就可以对中文进行 URL编码和解码。 import urllib.parse cn = input("请输入中文：") bfb = urllib.parse.quote(cn) # 转为 url 编码 print( bfb ) print( urllib.parse.unquo.

android 中文url编码,Android对中文url编码

weixin_39603609的博客

05-26

343

通过调用第三方APi数据，需要发送请求，之前URl请求中都是数字和字母，所以不会遇到返回的数据为空的问题，但是今天在发送的URL请求中含有中文了，就有问题了，在java中，不会出现访问中文URL有问题的现象，因为我一开始用的是MyEclipse写的测试，可以通过中文URL地址拿到数据，但是我把同样的代码copy到Android中就有问题了同一个方法，在MyEclipse中写测试的时候，可以拿到第三...

对url里面的中文进行编码

little_whiteToblack的博客

11-27

3489

对url进行中文编码有时候需要访问一些带有中文字符的网站，但是如果直接重定向的话会导致中文在浏览器的地址栏显示为？？？？此时使用正则表达式找出所有的中文字符，然后使用urlEncoder进行编码，然后拼接处最后的url @RequestMapping("/redirect") public ModelAndView redirect() throws UnsupportedEncodingException { String url = "https://www.你好UTF

URL中文编码与文本中文编码的关系

DivingKitten Coding驿站

01-22

1823

写在前面：系统环境：Windows 10 软件环境：360急速浏览器11.0，内核版本69（基于Chromium） URL在浏览器中编码在使用爬虫过程中，我们常常要对URL地址进行处理：在发包时对字符串进行编码；在接收数据时，对参数进行解码。由于现在常见的浏览器已经都对URL中的字符进行了解码，因此在使用浏览器时，地址栏中已经做到了正常中文字符通过浏览器的调试工具，能够查看到在网络上编码传...

Android对中文url编码

云淡风轻的博客

03-29

1万+

通过调用第三方APi数据，需要发送请求，之前URl请求中都是数字和字母，所以不会遇到返回的数据为空的问题，但是今天在发送的URL请求中含有中文了，就有问题了，在java中，不会出现访问中文URL有问题的现象，因为我一开始用的是MyEclipse写的测试，可以通过中文URL地址拿到数据，但是我把同样的代码copy到Android中就有问题了，这个是因为编码的问题，当URL中有中文的时候，浏览器是会自

使用python对url编码解码

热门推荐

junli_chen的博客

11-26

3万+

最近在抓取一些js代码产生的动态数据，需要模拟js请求获得所需用的数据，遇到对url进行编码和解码的问题，就把遇到的问题总结一下，有总结才有进步，才能使学到的知识更加清晰。对url进行编码和解码，python提供了很方便的接口进行调用。 url中的query带有特殊字符（不是url的保留字）时需要进行编码。当url中带有汉字时，需要特殊的处理才能正确编码，以下都只针对这种情形，当然也适用于纯

python转换URL中的中文编码

二木成林

12-02

1976

import urllib.request key = "中文" url = "https://www.baidu.com/s?word=" + urllib.request.quote(key) # 对中文进行转码 print(url) print(urllib.request.unquote(url)) # 对URL进行中文解码控制台打印： https://www.bai...

url中文转码问题(python)

Awesome_py的博客

07-15

2112

url中文转码问题%E6%94

Python - url 中中文编解码

小田的笔记簿

01-08

710

【代码】Python - url 中中文编解码。

python url中文转码_python实现中文转换url编码的方法

weixin_31869917的博客

01-13

5646

本文实例讲述了python实现中文转换url编码的方法。分享给大家供大家参考，具体如下：今天要处理百度贴吧的东西。想要做一个关键词的list，每次需要时，直接添加到list里面就可以了。但是添加到list里面是中文的情况(比如‘丽江')，url的地址编码却是'%E4%B8%BD%E6%B1%9F'，因此需要做一个转换。这里我们就用到了模块urllib。>>> import u...

Python3 中文与url格式编码的转换

u010741112的博客

05-26

829

我们在爬虫时，url链接中含有中文时，会自动被编码为特殊符号，因此我们需要对中文进行编码操作，同时也有可能涉及到对url编码后的中文进行解码操作。中文转换为url格式 from urllib.request import quote x = '角色扮演' print(quote('角色扮演')) 输出结果为： %E8%A7%92%E8%89%B2%E6%89%AE%E6%BC%94 将编码后的中文构造成完整url，借助字符串的format方法： url = 'https://www.taptap.c

【script】python 中文汉字与url的转换

qq_34965596的博客

03-24

2805

python中的urlencode和urldecode 【中文和url编码转换】

sherri_du的博客

05-31

4710

>>> brand_code='斑马' >>> from urllib import quote >>> print quote(brand_code) %B0%DF%C2%ED >>> from urllib import unquote >>> brand_code_url='%B0%DF%C2%ED' >>> print unquote(brand_code_url) 斑马 qu

Python3中文转换URL编码

weixin_34055787的博客

05-30

745

2019独角兽企业重金招聘Python工程师标准>>> ...