题目描述
某次科研调查时得到了n个自然数,每个数均不超过1500000000(1.5*109)。已知不相同的数不超过10000个,现在需要统计这些自然数各自出现的次数,并按照自然数从小到大的顺序输出统计结果。
题目输入
多组输入数据
每组数据包含n+1行:
第1行是整数n,表示自然数的个数。
第2~n+1行每行一个自然数。
题目输出
每组数据输出包含m行(m为n个自然数中不相同数的个数),按照自然数从小到大的顺序输出。每行输出两个整数,分别是自然数和该数出现的次数,其间用一个空格隔开。
样例输入
8
2
4
2
4
5
100
2
100
样例输出
2 3
4 2
5 1
100 2
解题思路
不用HASH的思路就是定义一个结构体,里面有两个参数,一是这个数的值,一是这个数出现的次数。然后开一个10000的结构体的数组,每读到一个数,就从头检查是不是以前读到过,如果读到过就cnt++ 没有读到过就在最后面把它加上。
这个算法是对的 但是对于200000的数据O(n^2)显然不行 所以要用HASH来优化数组的使用。思路是每次读到一个数,就对它模一个与10000差不多的素数,然后用模完的值做下标(假设是t)。如果没有数就直接放进去好了。如果发现s[t].num恰好就是读到的数,那么s[t].cnt++。如果发现这个位置被占了但s[t].num不是,就依次往后找到第一个没有被占的,把其存到这里。 这样就完成了HASH对数组的优化使用。
最后把数组中所有有效的都整理一下,sort一下输出即可。
详见代码
#include <cstdio> #include <cstring> #include <algorithm> using namespace std; const int maxn = 10020; struct node { int num; int cnt; }; node s[maxn]; node temp[maxn]; bool cmp(node a,node b) { return a.num < b.num; } int main() { int n; while(scanf("%d",&n) != EOF) { for(int i = 1 ; i < maxn ; i ++) { s[i].num = -1; s[i].cnt = 1; } while(n--) { int a; scanf("%d",&a); int t = a%10009; while(1) { if(s[t].num == a) { s[t].cnt ++; break; } if(s[t].num == -1) { s[t].num = a; break; } t ++; } } int pt = 1; for(int i = 1 ; i < maxn ; i ++) { if(s[i].num != -1) { temp[pt].num = s[i].num; temp[pt++].cnt = s[i].cnt; } } sort(temp+1,temp+pt,cmp); for(int i = 1 ; i < pt ; i ++) { printf("%d %d\n",temp[i].num,temp[i].cnt); } } return 0; }
原文:http://blog.csdn.net/area_52/article/details/42797053