Python 1.py
运行.py
文件.py
文件只能在命令行模式下print中 r'' 表示里面的字符默认不转义
多行字符串'''...'''表示法,可以结合r一起使用,r'''...'''表示多行字符串不转义
print('''a
b
c''')
>>> a
b
c
strip()去除前后空格
lstrip()去除前面空格
rstrip()去除后面空格
str.title()首字母大写
str.upper()/lowwer()全字母大小写
str(int_name) int数据转化为字符串
字符串连接直接使用 + ,整数和字符串不能直接连接,整数强制
转化为字符串str(int)+"str";
数组使用[]括起来,直接打印数组会将方括号和引号逗号一起打印出来,下标访问。
数组a.[-1]返回倒数第一个元素,-2倒数第二个,依次类推
append(),pop(index)可以弹出指定位置的元素,del(a[0]),insert(1,x);
remove(元素)删除第一个匹配的
len(list) :获取数组长度
** 代表^幂符号
列表切片
print(a[1:3])输出指定位置的元素
a=values[1:3]使用切片能复制列表
a=values直接使用等号使两个列表指向同一个对象
:
作为for的起始,4个空格缩进表示属于for循环的语句。if(list):
do something //if list is not null,do something
input(str):输入函数,接受一个参数,在输入前打印,将用户读入解读为字符串,使用int()函数转换
;
和\
#巨坑:!!!!!!
doc=pq(url,parser='html')#最好指定解析器为HTML,默认为xml,碰到XHTML网页会解析出错
# 创建PyQuery对象(css选择器)
from pyquery import PyQuery as pq #从库中导入PyQuery类并且定义别名为pq
# 可以使用''''''来表示字符串,这种表示方法可以接受换行
html='''
<div id="container">
<ul class="list">
<li class='item-0'>first item </li>
<li class='item-1'><a href="link2.html">second item< </li>
<li class ='item-a active'><a href="link3.html">< span class ="bold"> third item </span></a></li>
<li class ="item-1 active"><a href ="link4.html"〉fourth item</a></li>
<li class ="item-0"><a href= "link5.html"> fifth item</a></li>
</ul>
</div>
'''
doc =pq(url='http://www.baidu.com') #doc为PyQuery对象
# doc=pq(filename='demo.html')从文件中创建pq对象
# 元素选择,''中位css选择器
print(doc('li')) #选择出所有的li标签,并且所有<li> </li>标签的内容加上li标签打印
# 选择器的结果也是pq对象
print(type(doc('li')))
# 更高级的元素选择
print(doc('#container .lisr li'))# id标签#表示后面跟id名,class使用.表示后接名字,空格分隔
# 可以直接在''css选择器中使用空格分隔实现嵌套选择,无空格表示并列查询
r=requests.get(url) #访问网页,获取网页内容
r.encoding #获取当前对象的编码
rencoding='utf-8' #使当前对象转化为utf-8形式,如果网页是utf-8,而当前对象不是utf-8,则直接输出会乱码
原文:https://www.cnblogs.com/sstealer/p/11578643.html