Python 格式转换
在 Python 中,我们经常需要处理各种数据格式,我们需要将一种格式的数据转换为另一种格式,本文将介绍如何在 Python 中进行常见的数据格式转换。
1、文本文件与二进制文件
文本文件和二进制文件是两种常见的数据存储格式,文本文件以纯文本形式存储数据,而二进制文件则以字节流的形式存储数据,在 Python 中,我们可以使用内置的 open() 函数来读取和写入这两种格式的文件。
将一个文本文件转换为二进制文件:
with open("input.txt", "r") as f:
content = f.read()
with open("output.bin", "wb") as f:
f.write(content.encode("utf-8"))
2、JSON 与 CSV
JSON(JavaScript Object Notation)是一种轻量级的数据交换格式,常用于 Web 应用程序中,CSV(Comma-Separated Values)是一种简单的表格数据格式,可以用逗号分隔的值表示数据,在 Python 中,我们可以使用内置的 json 模块和第三方库 csv 来处理这两种格式的数据。
将一个 JSON 文件转换为 CSV 文件:
import json
import csv
with open("input.json", "r") as f:
data = json.load(f)
with open("output.csv", "w", newline="") as f:
writer = csv.writer(f)
writer.writerow(data[0].keys())
for row in data:
writer.writerow(row.values())
3、XML 与 HTML
XML(eXtensible Markup Language)是一种可扩展的标记语言,用于描述数据,HTML(HyperText Markup Language)是一种用于创建网页的标记语言,在 Python 中,我们可以使用第三方库 xml.etree.ElementTree 和 BeautifulSoup 来处理这两种格式的数据。
将一个 XML 文件转换为 HTML 文件:
from bs4 import BeautifulSoup
import xml.etree.ElementTree as ET
tree = ET.parse("input.xml")
root = tree.getroot()
html = BeautifulSoup("<html><body></body></html>", "html.parser")
body = html.find("body")
for child in root:
p = html.new_tag("p")
p.string = str(child.text)
body.append(p)
with open("output.html", "w") as f:
f.write(str(html))
4、Excel 与 Pandas DataFrame
Excel 是一种常见的电子表格格式,通常用于数据分析和处理,Pandas 是一个强大的数据处理库,支持多种数据格式的读写,在 Python 中,我们可以使用第三方库 pandas 来处理这两种格式的数据。
将一个 Excel 文件转换为 Pandas DataFrame:
import pandas as pd
df = pd.read_excel("input.xlsx")
print(df)
Python 提供了丰富的内置功能和第三方库,使得我们在处理各种数据格式时更加方便,希望本文能帮助您更好地理解如何在 Python 中进行数据格式转换。



还没有评论,来说两句吧...