编程面试题

  • 将数据框中具有多个值的单元格转换为多行

    我只是修复您的代码,因为我不建议您取消嵌套数据框的方法,因此您可以在此处检查答案,有多种不错的方法。 df2 = df.test1.str.split','.applypd.Series df2.index = df.s

  • Python cx_Oracle中的Oracle准备语句的IN子句

    Oracle不支持该概念-而且您绝对不是尝试这种方法的第一人!您必须: 为每个值创建单独的绑定变量-在Python中做起来相当简单直接 如下所示,在Oracle类型上使用强制转换运算符创建子查询:h

  • 如何从tkinter中按下的按钮获取网格信息?

    您可以通过对按钮使用lambda表达式来传递行和列: button = Button..., command=lambda row=i, column=j: doSomethingrow, column

  • 从z / os使用Python和ftplib.FTP下载文本文件

    在我试图弄清楚如何从z OS递归下载数据集时,刚遇到了这个问题。多年来,我一直在使用简单的python脚本从大型机下载ebcdic文件。它实际上只是这样做: def writelineline: file.writeline + "\n" file = openfilename, "w" ftp.retrlines"retr " + filename, writelin

  • 在序列中的for循环中查找项目的位置[重复]

    看看枚举 for i, season in enumerate'Spring Summer Fall Winter'.split, start=1: print i, season 1

  • Ascii文件中的Python BOM错误

    不要太在意“ with BOM”的说法。这可能不相关。该错误通常意味着您试图运行的Python不支持您声明的编码。观察: % head -1 tmp.py # -*- coding: asdfasdfasdf -*- % python tmp.py File "tmp.py", line 1 SyntaxError: encoding problem: with BOM

  • 零mq:socket.recv()调用被阻止

    如果传递zmq.NOBLOCKflag参数,zmq.Socket.recv将不会阻塞。 文档说: p

  • Seaborn图在同一散点图上的两个数据集

    以下应该在seaborn(0.9.0)的最新版本中起作用 import matplotlib.pyplot as plt import seaborn as sns 首先,我们将两个数据集连接为一个,并分配一dataset列,这将使我们可以保留有关哪个行来自哪个数据集的信息。 concate

  • python pptx更改整个表格的字体大小

    表中的字体大小是逐次运行设置的。因此,您可以在添加文本时这样做,或者之后可以执行以下操作: from pptx.util import Pt def iter_cellstable: for row in table.rows: for cell in row.cells: yield cell for cell in iter_cellstable:

  • 替换元组中的空字符串

    接下来呢? tuple'-' if x == '' else x for x in tup 正如Felix Kling所说,a href="http:diveintopython.netgetting_to_know_python

  • 在Django中创建自定义用户模型时,从models.Model和AuthUser继承之间有什么区别?

    第一个是多表继承。(我想您实际上是在说django.contrib.auth.models.User。)您的新用户模型将具有django用户模型中定义的所有字段。这是由django在模型上隐式创建一个OneToOneField来管理的。 第二个是您自己

  • 如何遍历字典列表,并在Ansible中打印出每个键和值对

    如果要遍历列表并分别解析每个项目,请执行以下操作: - debug: msg="{{ item | dictsort | map'join',':' | join' ' }}" with_items: "{{ myList }}" 将打印: "msg": "age:25 name:Bob" "msg": "address:USA

  • Openshift:OSError Errno 98无法更新服务器

    我今天下午发现有人有同样问题的帖子。看来Openshift改变了我们的某些事情。我没有备忘:。 在这里阅读: Openshift March博客文章 @MSDOS,它类似于您的答案,但我想发布可能影响大多数人的通用答案。

  • 在熊猫情节图例中显示非ASCII(日语)字符

    import numpy as np import pandas as pd import matplotlib.pyplot as plt import matplotlib.font_manager as font_manager df = pd.DataFrame data=np.random.random 2,2 , columns=[u'é',u'日本'] ax = df.plot legend =

  • allow_tags = True不呈现 在Django管理员中标记

    好的,所以这里的问题是list_display在html表单中,所以我试图在表单中显示表单,这是个坏主意…下面解释了为什么 您可以嵌套html表单吗? 希望能帮助到你。

  • PyAutoGui-按住键X秒钟

    如在文档字符串中所述pyautogui.keyDown: 在不释放键盘的情况下执行键盘按键。 这将使该键处于按下状态。 注意:出于某种原因, 这似乎不会导致重复按键, 就像在文本字段上按住键盘按键时一样。 您需要使用

  • (生物医学)单词词干的所有可能的单词形式完成

    此解决方案需要预处理您的语料库。但是一旦完成,这将是一个非常快速的字典查找。 from collections import defaultdict from stemming.porter2 import stem with open'usrsharedictwords' as f: words = f.read.splitlines stems = defaultdictli

  • pip安装失败,并显示“ __slots__中的ValueError:'format'与类变量冲突”

    原始软件包不适用于python3,但是有一个fork可以,您可以从https:github.comfusedantprogressbar- python3.git克隆它并运行

  • 将self用作Python方法中的临时变量是否有区别?

    第一个在类实例上创建持久引用,并且在方法范围之外的对象上可用。后者创建一个纯本地引用,该引用在方法之外将不可用。哪种情况更好取决于情况,但是如果实际上仅是临时变量,则使用局部(非self)变量。 情况1: foo = MyClass foo.MyVariable ... AttributeError: 'MyCla

  • 根据pyspark中的条件在spark中合并两行

    希望这可以帮助! ( 编辑说明: 在获取更新的需求之后对代码进行了调整) import pyspark.sql.functions as func #create RDD rdd = sc.parallelize[22,'C','xxx','yyy','zzz',23,'D','xxx','yyy','zzz',24,'C','xxx1','yyy1'

  • django删除源文件并生成pyc文件

    compileall 可用于编译项目目录中的所有Python脚本。 python -m compileall pathtoproject

  • numpy矩阵乘法形状[重复]

    *numpy数组的运算符是元素明智的乘法(类似于相同维数数组的Hadamard乘积),而不是矩阵乘法。 例如: a array[[0], [1], [2]] b array[0, 1, 2] a*b array[[0, 0, 0], [0,

  • 如何使用python从网站中提取带有匹配单词的html链接

    您需要india在 显示的文本中 搜索单词。为此,您需要一个自定义函数: from bs4 import BeautifulSoup import requests url = "http:www.bbc.comnewsworldasia" r = requests.geturl soup = BeautifulSoupr.content ind

  • module .__ init __()在Python中最多接受2个参数错误

    module.__init__ takes at most 2 arguments 3 given 这意味着您正在尝试从模块继承,而不是从类继承。其实datasets.imdb是一个模块;datasets.imdb.imdb是你的课。 您需要更改代码,使

  • 在Python中使用Selenium上传文件

    如果页面上有带有文件输入的表单,我认为直接在输入中填充值并使用selenium的python api提交表单是很简单的。您可以在文档页面上找到一些示例代码a href="http:seleniumhq.orgdocs03_webdriver.html#comman

  • 从日期时间对象中提取日期和月份

    与dt.day和dt.month-–Series.dt df = pd.DataFrame{'date':pd.date_rangestart='20

  • 如何从raw_input处理整数和字符串?

    让我用另一个问题回答您的问题: 是否真的需要混合字母和数字? 难道他们不都是字符串吗? 好吧,让我们走很长一段路,看看程序在做什么: 显示主菜单 询问接收用户输入 如果有效:确定 如果不是,请打印错误消息并

  • 如何在WTForms中使用“ tel”,“ number”或其他输入类型?

    WTForms文档似乎缺少此内容,但是HTML 5中添加了所有输入类型的字段定义。 from wtforms.fields.html5 import TelField phonenumber = TelField 在将它们添加到文档之前,a href="https:github.comwtformswtformsblob81f706asrcwtform

  • 使用Python将CSV转换为JSON(以特定格式)

    由于您已经在使用熊猫,因此我尝试从数据框方法中获取尽可能多的里程。我还最终在离您的实现很远的地方徘徊。不过,我认为这里的关键是不要对列表和或字典的理解变得过于聪明。您很容易混淆自己和阅读代码的每个人。 import pandas as pd from itertools import groupby from collections import OrderedDict import json df = p

  • 如何使用pandas-python递归构造数据帧的列?

    您可以使用: df.loc[0, 'diff'] = df.loc[0, 'val'] * 0.4 for i in range1, lendf: df.loc[i, 'diff'] = df.loc[i, 'val'] - df.loc[i-1, 'diff'] * 0.4 + df.loc[i-1, 'diff'] print df id_ val diff

  • 在整数列表中找到最长的0序列

    您可以先使用enumeratezip压缩带有索引的项目, 然后itertools.groupbylist,operator.itemgetter1按项目分组 仅0使用过滤listy for x,y in list if x == 0, 最后maxlist, ke

  • 从Pandas DataFrame删除重复项,并保留原始条件

    df A B 0 1 Ms 1 1 Ms 2 1 Ms 3 1 Ms 4 1 PhD 5 2 Ms 6 2 Ms 7 2 Bs 8 2 PhD 使用自定义函数对数据框进行排序: def sort_dfdf, column_idx, key:

  • 如何使用pip下载可用的Windows二进制文件以及所有其他源文件

    不,根据pip文档,这样的选项不存在: --only-binary format_control:请勿使用源程序包。可以多次提供,每次都增加到现有值。接受:all:禁用所有源软

  • 通过dbus传递大型数据结构

    我认为Dbus并不是发送大量数据的最佳方法。 如何将数据结构写出到 tmp中的文件,然后仅通过dbus在程序之间传递文件名呢?

  • 如何在Python中逐个加入列表?

    使用zip。 l1 = [1, 2, 3] l2 = [4, 5, 6] zipl1, l2 [1, 4, 2, 5, 3, 6] 请注意,如果列表的长度不同,结果将被截断为最短输入

  • 在Python中阅读和运行数学表达式

    由于python支持某些代数形式,因此您可以执行以下操作: eval"1 + 1" 但是,这允许输入执行环境中定义的任何内容: eval"__import__'sys'.exit1" 另外,如果您想支持python不支持的功能,则该方法将失败: x³ +

  • 在64位Windows 7计算机上使用Python构建COM服务器

    py2exe在64位Python上有一个错误。由py2exe初始化的sys.frozendllhandle无效,因此win32api.GetModuleFileName(sys.frozendllhandle)失败。 您可能想在a href="http:www.lfd.uci.edu~gohlk

  • 获取HTML标签的文本,而没有内部子标签的文本

    更新 为使用更通用的方法(请参阅编辑历史记录以获取原始答案): 您可以通过测试外部div的子元素是否是的实例来提取它们NavigableString。 from bs4

  • 熊猫在csv列中读取为float并将空单元格设置为0

    熊猫会自动使用NaN读取空值,因此只需使用fillna方法将其填充即可,并设置所需的新值(本例中为0)。 import pandas as pd df = pd.read_csv'data.csv'.fillnavalue = 0 产生: a b c 0 0.0 a 0.0 1 0.0 b 1.0 2

  • Django未安装在virtualenv中

    尝试进入virt1目录,然后运行“ binpip install django”。您正在使用系统范围内的点而不是virt1 bin中的点。 bin, include, lib, local当您在目录中初始化virtualenv时,它将创建四个目录()。“ lib”是virtualenv保留所有您的virtualenv特定python软件包的目录。使用bin b