笨办法学 Python · 续 练习 23:三叉搜索树

简介: 练习 23:三叉搜索树 原文:Exercise 23: Ternary Search Trees 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译我们将研究的最后一个数据结构称为三叉搜索树(TSTree),它可以在一组字符串中快速查找字符串。

练习 23:三叉搜索树

原文:Exercise 23: Ternary Search Trees

译者:飞龙

协议:CC BY-NC-SA 4.0

自豪地采用谷歌翻译

我们将研究的最后一个数据结构称为三叉搜索树(TSTree),它可以在一组字符串中快速查找字符串。它类似于BSTree,但是它有三个子节点,而不是两个,每个子节点只是一个字符而不是整个字符串。在BSTree中,左子节点和右子节点是树的“小于”和“大于”的分支。在TSTree中,左子节点,中子节点和右子节点是“小于”,“等于”和“大于”的分支。这可以让你选取一个字符串,将其分解成字符,然后遍历TSTree,每次一个字符,直到找到它或者你到达了末尾。

通过将你要搜索的一组键拆成单个字符的节点,TSTree高效地使用空间换取时间。每一个这些节点将占用比BSTree更多的空间,但这允许你仅仅通过比较键中的字符来搜索键。使用BSTree,你必须比较每个节点的键和被搜索键中的大多数字符。使用TSTree,你只需要比较被搜索键的每个字母,当你到达末尾,就完成了。

TSTree的另一件不错的事情是,它知道一个键何时不存在于集合中。想象一下,你的键的长度为 10 个字符,你需要在一组其他的键中找到它,但是如果键不存在,则需要快速停止。使用TSTree,你可以在一到两个字符的地方停止,到达树的末尾,并且知道这个键不存在。你最多只能比较键中的 10 个字符来发现它,字符比较比BSTree少得多。

挑战练习

这个练习中,你打算完成另一个“代码大师复制”的一部分,之后独立完成TSTree。你所需的代码是:

class TSTreeNode(object):

    def __init__(self, key, value, low, eq, high):
        self.key = key
        self.low = low
        self.eq = eq
        self.high = high
        self.value = value


class TSTree(object):

    def __init__(self):
        self.root = None

    def _get(self, node, keys):
        key = keys[0]
        if key < node.key:
            return self._get(node.low, keys)
        elif key == node.key:
            if len(keys) > 1:
                return self._get(node.eq, keys[1:])
            else:
                return node.value
        else:
            return self._get(node.high, keys)

    def get(self, key):
        keys = [x for x in key]
        return self._get(self.root, keys)

    def _set(self, node, keys, value):
        next_key = keys[0]

        if not node:
            # what happens if you add the value here?
            node = TSTreeNode(next_key, None, None, None, None)

        if next_key < node.key:
            node.low = self._set(node.low, keys, value)
        elif next_key == node.key:
            if len(keys) > 1:
                node.eq = self._set(node.eq, keys[1:], value)
            else:
                # what happens if you DO NOT add the value here?
                node.value = value
        else:
            node.high = self._set(node.high, keys, value)

        return node

    def set(self, key, value):
        keys = [x for x in key]
        self.root = self._set(self.root, keys, value)

你需要使用你学到的“代码大师复制”方法学习。要特别注意如何处理node.eq路径以及如何设置node.value。一旦你了解了getset的工作方式,你将实现剩下的函数和所有的测试。要实现的函数有:

find_shortest

给定一个关键字K,找到以K开头的最短键/值对。这意味着如果你的set中有appleapplication ,那么调用find_shortest("appl")将返回关联apple的值。

find_longest

给定一个关键字K,找到以K开头的最长键/值对。这意味着如果你的set中有appleapplication ,那么调用find_shortest("appl")将返回关联application的值。

find_all

给定一个关键字K,找到以K开头的所有键/值对。我会先实现它,然后基于它实现find_shortestfind_longest

find_part

给定一个关键字K,找到最短的键,它拥有K的开头的一部分。研究如何以及在哪里设置node.value来使其生效。

研究性学习

  • 查看原始代码的注释,看看在_set过程中,在哪里放置value。修改它会修改get的含义吗?为什么?
  • 确保你使用随机数据来测试,并测量一些性能。
  • 你也可以在TSTree中进行模糊匹配。我认为这是一个附加题,所以尝试实现它们,看看你想出了什么。模糊匹配是,'a.p.e'匹配"apple""anpxe""ajpqe"
  • 如何搜索字符串的结尾?提示:不要过度考虑它。
相关文章
|
1月前
|
Python
Python:函数篇(每周练习)
Python:函数篇(每周练习)
79 1
|
13天前
|
机器学习/深度学习 算法 搜索推荐
Machine Learning机器学习之决策树算法 Decision Tree(附Python代码)
Machine Learning机器学习之决策树算法 Decision Tree(附Python代码)
|
2月前
|
机器学习/深度学习 人工智能 算法
【Python】编程练习的解密与实战(一)
【Python】编程练习的解密与实战(一)
37 0
|
25天前
|
机器学习/深度学习 算法 数据挖掘
请解释Python中的决策树算法以及如何使用Sklearn库实现它。
决策树是监督学习算法,常用于分类和回归问题。Python的Sklearn库提供了决策树实现。以下是一步步创建决策树模型的简要步骤:导入所需库,加载数据集(如鸢尾花数据集),划分数据集为训练集和测试集,创建`DecisionTreeClassifier`,训练模型,预测测试集结果,最后通过`accuracy_score`评估模型性能。示例代码展示了这一过程。
|
22天前
|
数据采集 搜索推荐 数据挖掘
使用Python制作一个批量查询搜索排名的SEO免费工具
最近工作中需要用上 Google SEO(搜索引擎优化),有了解过的朋友们应该都知道SEO必不可少的工作之一就是查询关键词的搜索排名。关键词少的时候可以一个一个去查没什么问题,但是到了后期,一个网站都有几百上千的关键词,你再去一个一个查,至少要花费数小时的时间。 虽然市面上有很多SEO免费或者收费工具,但免费的基本都不能批量查,网上免费的最多也就只能10个10个查询,而且查询速度很慢。收费的工具如Ahrefs、SEMrush等以月为单位收费最低也都要上百美刀/月,当然如果觉得价格合适也可以进行购买,毕竟这些工具的很多功能都很实用。今天我给大家分享的这个排名搜索工具基于python实现,当然肯定
35 0
|
29天前
|
机器学习/深度学习 数据采集 算法
Python基础算法解析:决策树
Python基础算法解析:决策树
33 8
|
1月前
|
数据采集 存储 搜索推荐
使用Python构建自定义搜索引擎:从数据抓取到索引与搜索
使用Python构建自定义搜索引擎:从数据抓取到索引与搜索
43 0
|
2月前
|
Python
Python猜字游戏是一种常见的编程练习
Python猜字游戏是一种常见的编程练习
22 2
|
2月前
|
JSON API 数据格式
关键词搜索拼多多商品列表数据接口Python
关键词搜索拼多多商品列表数据接口Python
19 0
|
2月前
|
机器学习/深度学习 人工智能 算法
【Python】编程练习的解密与实战(四)
【Python】编程练习的解密与实战(四)
37 0