XML到熊猫数据框

问题内容：

我有一个包含数千行的XML文件，例如：

<Word x1="206" y1="120" x2="214" y2="144" font="Times-Roman" style="font-size:22pt">WORD</Word>

我想将其（所有属性）转换为pandas
dataframe。为此，我可以使用漂亮的汤在文件中循环浏览，并逐行插入值或创建要作为列插入的列表。但是我想知道是否有一种更Python的方式来完成我所描述的。先感谢您。

代码示例：

x1list=[]
x2list=[]

for word in soup.page.findAll('word'):
    x1list.append(int(word['x1']))
    x2list.append(int(word['x2']))
df=DataFrame({'x1':x1list,'x2':x2list})

问题答案：

尝试这个：

DataFrame.from_records([(int(word['x1']), int(word['x2']))
                        for word in soup.page.findAll('word')],
                       columns=('x1', 'x2'))

XML到熊猫数据框

微信关注