首页 > 其他 > 详细

Trie树

时间:2015-09-14 22:35:52      阅读:398      评论:0      收藏:0      [点我收藏+]
http://hihocoder.com/problemset/problem/1014

描述

小Hi和小Ho是一对好朋友,出生在信息化社会的他们对编程产生了莫大的兴趣,他们约定好互相帮助,在编程的学习道路上一同前进。

这一天,他们遇到了一本词典,于是小Hi就向小Ho提出了那个经典的问题:“小Ho,你能不能对于每一个我给出的字符串,都在这个词典里面找到以这个字符串开头的所有单词呢?

身经百战的小Ho答道:“怎么会不能呢!你每给我一个字符串,我就依次遍历词典里的所有单词,检查你给我的字符串是不是这个单词的前缀不就是了?

小Hi笑道:“你啊,还是太年轻了!~假设这本词典里有10万个单词,我询问你一万次,你得要算到哪年哪月去?”

小Ho低头算了一算,看着那一堆堆的0,顿时感觉自己这辈子都要花在上面了...

小Hi看着小Ho的囧样,也是继续笑道:“让我来提高一下你的知识水平吧~你知道树这样一种数据结构么?”

小Ho想了想,说道:“知道~它是一种基础的数据结构,就像这里说的一样!”

小Hi满意的点了点头,说道:“那你知道我怎么样用一棵树来表示整个词典么?”

小Ho摇摇头表示自己不清楚。

提示一:Trie树的建立

“你看,我们现在得到了这样一棵树,那么你看,如果我给你一个字符串ap,你要怎么找到所有以ap开头的单词呢?”小Hi又开始考校小Ho。

“唔...一个个遍历所有的单词?”小Ho还是不忘自己最开始提出来的算法。

“笨!这棵树难道就白构建了!”小Hi教训完小Ho,继续道:“看好了!”

提示二:如何使用Trie树

提示三:在建立Trie树时同时进行统计!

“那么现在!赶紧去用代码实现吧!”小Hi如是说道

输入

输入的第一行为一个正整数n,表示词典的大小,其后n行,每一行一个单词(不保证是英文单词,也有可能是火星文单词哦),单词由不超过10个的小写英文字母组成,可能存在相同的单词,此时应将其视作不同的单词。接下来的一行为一个正整数m,表示小Hi询问的次数,其后m行,每一行一个字符串,该字符串由不超过10个的小写英文字母组成,表示小Hi的一个询问。

在20%的数据中n, m<=10,词典的字母表大小<=2.

在60%的数据中n, m<=1000,词典的字母表大小<=5.

在100%的数据中n, m<=100000,词典的字母表大小<=26.

本题按通过的数据量排名哦~

  1. 输出
  2. 对于小Hi的每一个询问,输出一个整数Ans,表示词典中以小Hi给出的字符串为前缀的单词的个数。
  3. 样例输入
  4. 5
  5. babaab
  6. babbbaaaa
  7. abba
  8. aaaaabaa
  9. babaababb
  10. 5
  11. babb
  12. baabaaa
  13. bab
  14. bb
  15. bbabbaab
  16. 样例输出
  17. 1
  18. 0
  19. 3
  20. 0
  21. 0

键树:又称为数字查找树,利用的是字符串的公共前缀来降低时空开销。

主要用于统计和排序大量的字符串,所以经常被搜索引擎系统用于文本词频的统计。

存储格式:1、双链树。2、多重链表。下图是一棵键树。

技术分享

代码如下:
  1. #include <string.h>
  2. #include <iostream>
  3. #include <string>
  4. using namespace std;
  5. struct Trie_node{
  6. Trie_node *next[26];        //总共26个字母,所以最多具有26个分支。
  7. bool is_word;               //在本题中可以不要。
  8. int count;                  //用来记录该链下面具有的单词个数。  
  9. Trie_node():count(0),is_word(false){
  10. memset(next,NULL,sizeof(next));
  11. }
  12. };
  13. //建立键树
  14. void insert(Trie_node *root,const string &str){
  15. Trie_node *p = root;
  16. int i = 0;
  17. while(i < str.size()){
  18. if(p->next[str[i] - ‘a‘] == NULL){
  19. Trie_node *tmp = new Trie_node();
  20. p->next[str[i] - ‘a‘] = tmp;
  21. }
  22. p->next[str[i] - ‘a‘]->count++;        //每插入一个单词,则在该链路上增加统计
  23. p = p->next[str[i] - ‘a‘];
  24. i++;
  25. }
  26. p->is_word = true;
  27. }
  28. int search(Trie_node *root, const string &word){
  29. Trie_node *p = root;
  30. int result = 0;
  31. for(int i = 0; i < word.size(); ++i){
  32. p = p->next[word[i]-‘a‘];
  33. if(p == NULL){
  34. break;
  35. }
  36. }
  37. if(p!=NULL){
  38. result = p->count;
  39. }
  40. return result;
  41. }
  42. void deleteTrie(Trie_node *root){
  43. for(int i =0; i < 25; i++){
  44. if(root->next[i]!=NULL){
  45. deleteTrie(root->next[i]);
  46. }
  47. }
  48. delete root;
  49. }

  50. int main(){
  51. int n;
  52. cin >> n;
  53. Trie_node *root = new Trie_node();
  54. string str;
  55. for(int i = 0; i < n; ++i){
  56. cin >> str;
  57. insert(root,str);
  58. }
  59. int findNum = 0;
  60. cin >> findNum;
  61. for(int j = 0; j < findNum; ++j){
  62. cin >> str;
  63. cout << search(root,str) << endl;
  64. }
  65. deleteTrie(root);
  66. system("pause");
  67. return 0;
  68. }


 
 




Trie树

原文:http://www.cnblogs.com/chenzhengyu/p/4808200.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!