Python爬虫基础讲解(八):数据持久化——文件操作

时间:2021-7-3 作者:qvyue

Python爬虫、数据分析、网站开发等案例教程视频免费在线观看

https://space.bilibili.com/523606542 

计算机的文件,就是存储在某种长期储存设备上的一段数据长期存储设备包括:硬盘、U盘、移动硬盘、光盘…

文本文件和二进制文件

文本文件:

  • 可以使用文本编辑软件查看o本质上还是二进制文件
  • 例如: python的源程序

二进制文件:

  • 保存的内容不是给人直接阅读的,而是提供给其他软件使用的。
  • 例如:图片文件、音频文件、视频文件等等
  • 二进制文件不能使用文本编辑软件查看

1. 文件的基本操作

操作文件的函数/方法

在Python中要操作文件需要记住1个函数和3个方法

Python爬虫基础讲解(八):数据持久化——文件操作
  • open函数负责打开文件,并且返回文件对象
  • read / write/ close三个方法都需要通过文件对象来调用

1. 1读取文件

open

函数的第一个参数是要打开的文件名(文件名区分大小写)

  • 如果文件存在,返回文件操作对象
  • 如果文件不存在,会抛出异常
  • read方法可以一次性读入并返回文件的所有内容
  • close方法负责关闭文件
    如果忘记关闭文件,会造成系统资源消耗,而且会影响到后续对文件的访问
  • 注意:read方法执行后,会把文件指针移动到文件的末尾
# 1.打开-文件名需要注意大小写
file = open("README")

#2.读取
text = file.read()
print(text)

#3.关闭
file.close()

1.2 打开文件的方式

open函数默认以只读方式打开文件,并且返回文件对象
语法如下:

f = open("文件名","访问方式")
Python爬虫基础讲解(八):数据持久化——文件操作

提示

  • 频繁的移动文件指针,会影响文件的读写效率,开发中更多的时候会以只读、只写的方式来操作文件

写入文件示例

#打开文件
f = open ("README","w")

f.write( "he17o python! n")
f.write("今天天气真好")

#关闭文件
f.close()

1.3按行读取文件内容

  • read()方法
    默认会把文件的所有内容一次性读取到内存。如果文件太大,对内存的占用会非常严重。

  • readline方法
    readline方法可以一次读取一行内容。方法执行后,会把文件指针移动到下一行,准备再次读取。
    这是读取大文件的正确姿势。

2. 目录操作

  • 在终端/文件浏览器、中可以执行常规的文件/目录管理操作,例如:
    创建、重命名、删除、改变路径、查看目录内容、…….

  • 在Python中,如果希望通过程序实现上述功能,需要导入os模块

2.1 文件操作

Python爬虫基础讲解(八):数据持久化——文件操作

2.2 目录操作

Python爬虫基础讲解(八):数据持久化——文件操作

提示:文件或者目录操作都支持相对路径和绝对路径

声明:本文内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:qvyue@qq.com 进行举报,并提供相关证据,工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。