Django Haystack和Whoosh搜索正常,但SearchQuerySet返回0个结果


问题内容

编辑:更多信息在帖子的底部…

原始问题:

我似乎遇到了与这个(未解决的)问题相同的问题: django-haystack + Whoosh
SearchQuerySet()。all()始终无

我已经在我的Django项目上使用Whoosh设置了Haystack,并且所有功能起初都运行良好(SearchQuerySet用于返回结果),但是在尝试创建新的自定义搜索表单(从git中回滚)失败之后,索引和原始搜索页面仍然可以正常工作,但是现在SearchQuerySet()始终返回0个结果!

运行:

manage.py rebuild_index --verbosity=2

正确显示:

Indexing 14 assets
    indexed 1 - 14 of 14 (worker PID: 1234).

然后,可以从原始搜索表单中正确搜索所有这些索引资产。

但是,打开Django shell并运行:

from haystack.query import SearchQuerySet
SearchQuerySet().all().count()

总是返回0

相关pip freeze

  • Python 3.5.2
  • 的Django 1.9.3
  • django-干草堆2.5.0
  • 飞快移动2.7.4

/myapp/search_indexes.py:

from haystack import indexes
from .models import Asset

class AssetIndex(indexes.SearchIndex, indexes.Indexable):
    text = indexes.NgramField(document=True, use_template=True)
    asset_description = indexes.CharField(model_attr='asset_description')
    manufacturer = indexes.CharField(model_attr='asset_manufacturer')

    def get_model(self):
        return Asset

    def no_query_found(self):
        return self.searchqueryset.exclude(content='foo')

    def index_queryset(self, using=None):
        return self.get_model().objects.all()

/myapp/templates/search/indexes/myapp/asset_text.txt:

{{ object.asset_description }}
{{ object.asset_details }}
{{ object.asset_manufacturer }}
{{ object.asset_model }}
... etc.

/myapp/urls.py:

urlpatterns = [
    ....
    url(r'^search/', include('haystack.urls')),
    ....
]

编辑:

因此,深入研究Haystack源代码,我发现了0的来源,而不是为什么!

/myvenv/Lib/site-packages/hackstack/query.py

class SearchQuerySet(object):
    ...

    def __len__(self):
        if self._result_count is None:
            self._result_count = self.query.get_count()

        # Some backends give weird, false-y values here. Convert to zero.
        if not self._result_count:
            self._result_count = 0

    # This needs to return the actual number of hits, not what's in the cache.
    return self._result_count - self._ignored_result_count

    ....

0int更改为任何int会使SearchQuerySet始终返回该int,但我仍然不知道为什么if not self._result_count会如此。


问题答案:

看起来这是干草堆中的一个错误,该错误已被报告,但尚未得到解决:

https://github.com/django-haystack/django-
haystack/issues/1021

不幸的是,如果“文本”索引字段是Ngram或EdgeNgram,SearchQuerySet().count()并且除非指定过滤器,否则SearchQuerySet().all().count()将返回0,例如,SearchQuerySet().all().exclude(content='thisshouldnotmatchanythingintheindex').count()返回索引对象的总数。