python用两种要领实现url短毗连
险些所有的微薄都提供了缩短网址的处事,其道理就是将一个url地点凭据必然的算法生成一段字符串,然后加在一个短域名后头边成了一个新的url地点,数据库中会存放这个短地点和原始的地点,当用户点击这个新的短地点后,短地点处事会按照短域名后头的几个字符串从数据库中读出本来的地点然后页面举办跳转 。
好比新浪微薄中的url 是 http://t.cn/xxxxxxx t.cn是其域名 ,其后头随着的是7位算出来的字符串。
要领一:利用哈希库自界说算法
因为文本中显示太长的url会较量乱,可能回收省略显示的方法,可能回收短url的方法.
为了同时利便统计点击数以及举办内容过滤.实现了一个生成短url值的要领.
为了防备你的hash值被破解,可以在生成md5值的时候插手你本身的salt.
这样即便直到你的code_map也不能破解到原始url了.
为了让功效越发随机,把每次轮回没有利用的第二个bit生存到e内里.这样可以让功效斗嘴率更小.
#引入哈希库
import hashlib
def get_md5(s):
s = s.encode('utf8') if isinstance(s, unicode) else s
m = hashlib.md5()
m.update(s)
return m.hexdigest()
code_map = (
'a' , 'b' , 'c' , 'd' , 'e' , 'f' , 'g' , 'h' ,
'i' , 'j' , 'k' , 'l' , 'm' , 'n' , 'o' , 'p' ,
'q' , 'r' , 's' , 't' , 'u' , 'v' , 'w' , 'x' ,
'y' , 'z' , '0' , '1' , '2' , '3' , '4' , '5' ,
'6' , '7' , '8' , '9' , 'A' , 'B' , 'C' , 'D' ,
'E' , 'F' , 'G' , 'H' , 'I' , 'J' , 'K' , 'L' ,
'M' , 'N' , 'O' , 'P' , 'Q' , 'R' , 'S' , 'T' ,
'U' , 'V' , 'W' , 'X' , 'Y' , 'Z'
)
def get_hash_key(long_url):
hkeys = []
hex = get_md5(long_url)
for i in xrange(0, 4):
n = int(hex[i*8:(i+1)*8], 16)
v = []
e = 0
for j in xrange(0, 5):
x = 0x0000003D & n
e |= ((0x00000002 & n ) >> 1) << j
v.insert(0, code_map[x])
n = n >> 6
e |= n << 5
v.insert(0, code_map[e & 0x0000003D])
hkeys.append(''.join(v))
return hkeys
if __name__ == '__main__':
print get_hash_key('http://www.pythontab.com')
要领二:利用libsurl库
libsurl 是一个用来生成短URL的C和Python库,支持 bit.ly 和 tinyurl 等短url 处事网站。