编程面试题

将数据框中具有多个值的单元格转换为多行

我只是修复您的代码，因为我不建议您取消嵌套数据框的方法，因此您可以在此处检查答案，有多种不错的方法。 df2 = df.test1.str.split','.applypd.Series df2.index = df.s

Python cx_Oracle中的Oracle准备语句的IN子句

Oracle不支持该概念-而且您绝对不是尝试这种方法的第一人！您必须：为每个值创建单独的绑定变量-在Python中做起来相当简单直接如下所示，在Oracle类型上使用强制转换运算符创建子查询：h

如何从tkinter中按下的按钮获取网格信息？

您可以通过对按钮使用lambda表达式来传递行和列： button = Button..., command=lambda row=i, column=j: doSomethingrow, column

从z / os使用Python和ftplib.FTP下载文本文件

在我试图弄清楚如何从z OS递归下载数据集时，刚遇到了这个问题。多年来，我一直在使用简单的python脚本从大型机下载ebcdic文件。它实际上只是这样做： def writelineline: file.writeline + "\n" file = openfilename, "w" ftp.retrlines"retr " + filename, writelin

在序列中的for循环中查找项目的位置[重复]

看看枚举 for i, season in enumerate'Spring Summer Fall Winter'.split, start=1: print i, season 1

Ascii文件中的Python BOM错误

不要太在意“ with BOM”的说法。这可能不相关。该错误通常意味着您试图运行的Python不支持您声明的编码。观察： % head -1 tmp.py # -*- coding: asdfasdfasdf -*- % python tmp.py File "tmp.py", line 1 SyntaxError: encoding problem: with BOM

零mq：socket.recv（）调用被阻止

如果传递zmq.NOBLOCKflag参数，zmq.Socket.recv将不会阻塞。文档说： p

Seaborn图在同一散点图上的两个数据集

以下应该在seaborn（0.9.0）的最新版本中起作用 import matplotlib.pyplot as plt import seaborn as sns 首先，我们将两个数据集连接为一个，并分配一dataset列，这将使我们可以保留有关哪个行来自哪个数据集的信息。 concate

python pptx更改整个表格的字体大小

表中的字体大小是逐次运行设置的。因此，您可以在添加文本时这样做，或者之后可以执行以下操作： from pptx.util import Pt def iter_cellstable: for row in table.rows: for cell in row.cells: yield cell for cell in iter_cellstable:

替换元组中的空字符串

接下来呢？ tuple'-' if x == '' else x for x in tup 正如Felix Kling所说，a href="http:diveintopython.netgetting_to_know_python

在Django中创建自定义用户模型时，从models.Model和AuthUser继承之间有什么区别？

第一个是多表继承。（我想您实际上是在说django.contrib.auth.models.User。）您的新用户模型将具有django用户模型中定义的所有字段。这是由django在模型上隐式创建一个OneToOneField来管理的。第二个是您自己

如何遍历字典列表，并在Ansible中打印出每个键和值对

如果要遍历列表并分别解析每个项目，请执行以下操作： - debug: msg="{{ item | dictsort | map'join',':' | join' ' }}" with_items: "{{ myList }}" 将打印： "msg": "age:25 name:Bob" "msg": "address:USA

Openshift：OSError Errno 98无法更新服务器

我今天下午发现有人有同样问题的帖子。看来Openshift改变了我们的某些事情。我没有备忘:。在这里阅读： Openshift March博客文章 @MSDOS，它类似于您的答案，但我想发布可能影响大多数人的通用答案。

import numpy as np import pandas as pd import matplotlib.pyplot as plt import matplotlib.font_manager as font_manager df = pd.DataFrame data=np.random.random 2,2 , columns=[u'é',u'日本'] ax = df.plot legend =

allow_tags = True不呈现在Django管理员中标记

好的，所以这里的问题是list_display在html表单中，所以我试图在表单中显示表单，这是个坏主意…下面解释了为什么您可以嵌套html表单吗？希望能帮助到你。

PyAutoGui-按住键X秒钟

如在文档字符串中所述pyautogui.keyDown：在不释放键盘的情况下执行键盘按键。这将使该键处于按下状态。注意：出于某种原因，这似乎不会导致重复按键，就像在文本字段上按住键盘按键时一样。您需要使用

（生物医学）单词词干的所有可能的单词形式完成

此解决方案需要预处理您的语料库。但是一旦完成，这将是一个非常快速的字典查找。 from collections import defaultdict from stemming.porter2 import stem with open'usrsharedictwords' as f: words = f.read.splitlines stems = defaultdictli

pip安装失败，并显示“ slots中的ValueError：'format'与类变量冲突”

原始软件包不适用于python3，但是有一个fork可以，您可以从https:github.comfusedantprogressbar- python3.git克隆它并运行

将self用作Python方法中的临时变量是否有区别？

第一个在类实例上创建持久引用，并且在方法范围之外的对象上可用。后者创建一个纯本地引用，该引用在方法之外将不可用。哪种情况更好取决于情况，但是如果实际上仅是临时变量，则使用局部（非self）变量。情况1： foo = MyClass foo.MyVariable ... AttributeError: 'MyCla

根据pyspark中的条件在spark中合并两行

希望这可以帮助！（编辑说明：在获取更新的需求之后对代码进行了调整） import pyspark.sql.functions as func #create RDD rdd = sc.parallelize[22,'C','xxx','yyy','zzz',23,'D','xxx','yyy','zzz',24,'C','xxx1','yyy1'

django删除源文件并生成pyc文件

compileall 可用于编译项目目录中的所有Python脚本。 python -m compileall pathtoproject

numpy矩阵乘法形状[重复]

*numpy数组的运算符是元素明智的乘法（类似于相同维数数组的Hadamard乘积），而不是矩阵乘法。例如： a array[[0], [1], [2]] b array[0, 1, 2] a*b array[[0, 0, 0], [0,

如何使用python从网站中提取带有匹配单词的html链接

您需要india在显示的文本中搜索单词。为此，您需要一个自定义函数： from bs4 import BeautifulSoup import requests url = "http:www.bbc.comnewsworldasia" r = requests.geturl soup = BeautifulSoupr.content ind

module . init （）在Python中最多接受2个参数错误

module.__init__ takes at most 2 arguments 3 given 这意味着您正在尝试从模块继承，而不是从类继承。其实datasets.imdb是一个模块；datasets.imdb.imdb是你的课。您需要更改代码，使

在Python中使用Selenium上传文件

如果页面上有带有文件输入的表单，我认为直接在输入中填充值并使用selenium的python api提交表单是很简单的。您可以在文档页面上找到一些示例代码a href="http:seleniumhq.orgdocs03_webdriver.html#comman

从日期时间对象中提取日期和月份

与dt.day和dt.month-–Series.dt df = pd.DataFrame{'date':pd.date_rangestart='20

如何从raw_input处理整数和字符串？

让我用另一个问题回答您的问题：是否真的需要混合字母和数字？难道他们不都是字符串吗？好吧，让我们走很长一段路，看看程序在做什么：显示主菜单询问接收用户输入如果有效：确定如果不是，请打印错误消息并

如何在WTForms中使用“ tel”，“ number”或其他输入类型？

WTForms文档似乎缺少此内容，但是HTML 5中添加了所有输入类型的字段定义。 from wtforms.fields.html5 import TelField phonenumber = TelField 在将它们添加到文档之前，a href="https:github.comwtformswtformsblob81f706asrcwtform

使用Python将CSV转换为JSON（以特定格式）

由于您已经在使用熊猫，因此我尝试从数据框方法中获取尽可能多的里程。我还最终在离您的实现很远的地方徘徊。不过，我认为这里的关键是不要对列表和或字典的理解变得过于聪明。您很容易混淆自己和阅读代码的每个人。 import pandas as pd from itertools import groupby from collections import OrderedDict import json df = p

如何使用pandas-python递归构造数据帧的列？

您可以使用： df.loc[0, 'diff'] = df.loc[0, 'val'] * 0.4 for i in range1, lendf: df.loc[i, 'diff'] = df.loc[i, 'val'] - df.loc[i-1, 'diff'] * 0.4 + df.loc[i-1, 'diff'] print df id_ val diff

在整数列表中找到最长的0序列

您可以先使用enumeratezip压缩带有索引的项目，然后itertools.groupbylist,operator.itemgetter1按项目分组仅0使用过滤listy for x,y in list if x == 0，最后maxlist, ke

从Pandas DataFrame删除重复项，并保留原始条件

df A B 0 1 Ms 1 1 Ms 2 1 Ms 3 1 Ms 4 1 PhD 5 2 Ms 6 2 Ms 7 2 Bs 8 2 PhD 使用自定义函数对数据框进行排序： def sort_dfdf, column_idx, key:

如何使用pip下载可用的Windows二进制文件以及所有其他源文件

不，根据pip文档，这样的选项不存在： --only-binary format_control：请勿使用源程序包。可以多次提供，每次都增加到现有值。接受：all：禁用所有源软

通过dbus传递大型数据结构

我认为Dbus并不是发送大量数据的最佳方法。如何将数据结构写出到 tmp中的文件，然后仅通过dbus在程序之间传递文件名呢？

如何在Python中逐个加入列表？

使用zip。 l1 = [1, 2, 3] l2 = [4, 5, 6] zipl1, l2 [1, 4, 2, 5, 3, 6] 请注意，如果列表的长度不同，结果将被截断为最短输入

在Python中阅读和运行数学表达式

由于python支持某些代数形式，因此您可以执行以下操作： eval"1 + 1" 但是，这允许输入执行环境中定义的任何内容： eval"__import__'sys'.exit1" 另外，如果您想支持python不支持的功能，则该方法将失败： x³ +

在64位Windows 7计算机上使用Python构建COM服务器

py2exe在64位Python上有一个错误。由py2exe初始化的sys.frozendllhandle无效，因此win32api.GetModuleFileName（sys.frozendllhandle）失败。您可能想在a href="http:www.lfd.uci.edu~gohlk

获取HTML标签的文本，而没有内部子标签的文本

更新为使用更通用的方法（请参阅编辑历史记录以获取原始答案）：您可以通过测试外部div的子元素是否是的实例来提取它们NavigableString。 from bs4

熊猫在csv列中读取为float并将空单元格设置为0

熊猫会自动使用NaN读取空值，因此只需使用fillna方法将其填充即可，并设置所需的新值（本例中为0）。 import pandas as pd df = pd.read_csv'data.csv'.fillnavalue = 0 产生： a b c 0 0.0 a 0.0 1 0.0 b 1.0 2

Django未安装在virtualenv中

尝试进入virt1目录，然后运行“ binpip install django”。您正在使用系统范围内的点而不是virt1 bin中的点。 bin, include, lib, local当您在目录中初始化virtualenv时，它将创建四个目录（）。“ lib”是virtualenv保留所有您的virtualenv特定python软件包的目录。使用bin b

微信关注