VC/MFC
VB
Delphi
C++ Builder
C/C++
Java
.NET技术
MS-SQL Server
PowerBuilder
DB2
Oracle
Web 开发
Linux/Unix社区
硬件/嵌入开发
移动平台
您的位置:
程序门
->
专题开发/技术/项目
-> 数据结构与算法
续-假如有一亿个文章或书名,标题不重复……
[
收藏此页
] [
打印本页
]选择字色:
默认
灰色
红色
黄色
绿色
橙色
紫色
蓝色
褐色
墨绿
深蓝
赭石
粉绿
淡绿
黄灰
翠绿
综红
砖红
淡蓝
暗红
玫瑰红
紫红
桔黄
军黄
烟灰
深灰
灰蓝
背景色:
默认
黑色
红色
黄色
绿色
橙色
紫色
蓝色
褐色
墨绿
深蓝
赭石
粉绿
淡绿
黄灰
翠绿
综红
砖红
淡蓝
暗红
玫瑰红
紫红
桔黄
军黄
烟灰
深灰
灰蓝
字体:[
大
][
中
][
小
]
续-假如有一亿个文章或书名,标题不重复……
发表于:
2007-02-14 13:28:02
楼主
http://community.csdn.net/expert/topic/5340/5340679.xml?temp=4.165286e-02
原贴在上面这地址,因为回帖多,感觉分不够给了,开个新贴
谢谢大家的支持,我已经确定用b树做了,另外用静态变量做缓存,把经常查询到的10万条存在哈系表里,我想10万条作缓存够用了,因为数据虽多,但大部分是级少访问到的东西。
缓存方面制作没有什么问题,http://3http.com是我编写的论坛程序,也用了不少缓存,大家有兴趣可以看下。
但我在b树这方面还不太懂,原理什么的大概了解了,不过具体的例子没找到过,还有我的建立过程是让程序自动一条条的添加过程,我发现b树添加的过程中,是一分为二那么简单,但必需有个整理过程,即保证每层树都差不多多的子层数,就有可能需要移动大量的数据,感觉难点还在这个上面,因为数据实时在用,又要考虑移动这一点。
下面是我的制作思路,有兴趣的朋友提下意见
标题→自身id号→自身的数据文本→对应的书(可能多本)
↘
自身的数据缓存
另外我说的一亿条,只是标题数量有一亿条,然后对应id号(自动生成,数字形式),id号对应具体的一个文本文件,文本文件里存放对应的本书,可能对应多本书,但这具体的书的数量就少多了,也采用id号顺序一本本的添加。
是一本书对应着很多标题,查询的是标题
发表于:
2007-02-15 14:34:29
1
楼 得分:
0
用数据库不是很简单?为何要缓存?用数据库查询时间 <1s
发表于:
2007-02-15 15:23:45
2
楼 得分:
0
用缓存快
发表于:
2007-02-20 18:27:35
3
楼 得分:
0
3http.com这个论坛很有意思,页面即时响应,用户体验不错。
不明白b树移动什么意思,b树的移动应该只在结点内部,这个量不大,而且可以在内存中进行,然后整个结点写回硬盘。难道指的是结点在硬盘中的位置也要整理,反正保存地址物理位置随机没关系。
相同标题对应的多本书是在同一个id的文本文件中,还是不同文件中?
发表于:
2007-06-12 12:53:52
4
楼 得分:
0
老贴,顶下
发表于:
2007-06-15 10:27:12
5
楼 得分:
0
数据库方案
1、把文章分组,比如首字母之类的分组方法
2、每组放到不同表中
3、查询时,先判断是哪一组,然后再查询该表
举例:身份证查询,你设计的话不会把全国13亿的号码都放一起查询吧,甚至包括被注销的
数据库已经很完善了,用得好,几亿数据量又算什么。
不用数据库?
费用问题?可以选用免费的
性能问题?你能保证你写的算法比常用的数据库好?我看这几乎是吹牛。
就是不想用数据库,想用算法讨论学习而已?
题外话,楼主没说出影响设计的初衷,这是本帖的败点。
要求达到某个性能、要求开发时间有限制、是否考虑软件费用等等都没具体提。
简单来说,楼主就是需求表达不清,方向不明,导致游客理解各有着重,回答形形色色。
发表于:
2007-06-22 00:57:48
6
楼 得分:
0
简单的方法, 树, 前面有说过这方法
举个例子:
文章或书名为: "代码手册 "
代码 的hex 为: b4 fa c2 eb
那么读取文件 c:\b4\fa\c2\fb\file.txt (前两个字为路径)
如果保存文件的路径, 加名称1024个字节那么1亿个文件
1000000000/128/128/128/128 = 3.7
1024*3.7 < 4096, 这个文件小于4k, 这个速度应该比较块了吧!
发表于:
2007-06-23 21:49:33
7
楼 得分:
0
当然是数据库拉!
下一篇:
高手给剖析一下这个画圆的算法,谢谢
上一篇:
采用三元组存储稀疏矩阵 <在线等待... >
相关文章
四国军旗网络版c#代码
当用机顶盒播放时,快退键功能与推出键功能一样!...
socket通信中如何把通信信息存入数据库? &...
vmr-9不能输出吗??
rtp封装的视频应该如何播放,其中rtp有效载荷格式...
关于google map api 的一个问题
100分求解:星际对战连接遇到棘手问题:unable&n...
哪些平台可以支持英保通方案?来这里找。!!
淘宝这样的电子商务网站,搜索引擎是如何做的?
系统安全最大软肋到底是什么?
熬了一整夜,终于抢到了一个喜欢的手机号,超爽!...
游戏公司招聘,代人发帖!
mpeg-4编解码问题
识别动网asp论坛验证码的源代码
★网站使用搜索引擎的重要性★
【求思路】求1条自交折线所构成的所有封闭区域
基于udp的语音通信需要如何实现?
在100个数任取n个各不相同的数,请问包含某个指定...
0.015秒是这样炼成的。测试数据太弱了。
转让北京尚学堂java培训班后两个半月的课程!!并送...
其他资讯
求教——os
请问有关lame acm问题,请高手指教
请教基于mfc的h.264播放器的开发问题
传输层如何分割数据段
谁给我提供一个服务器控制改客户机桌面壁纸的方法...
请问是否有关于 非对称加密 的具体vb程...
关于用gdi+实现图像的阴影
2道迅雷的算法笔试题目,大伙有意说一啊
有哪些图象处理方面的英文资料? 急!谢谢
请问各位大侠iccompressorchoose这个方法如何使用...
google现在都有什么应用?
我也来拿点分
我的锋行x7060怎么是两个cup?
求助高手,帮忙看一段关于rgb转换的很短的代码
求有关图的一些算法
求一个快速分解bit位的方法
(c#)window media player控 怎么...
英特尔7月调价芯片反击amd 最高降50%
问个seo 问题:怎么样才能让google收录带ww...
opengl 中如何填充一个不规则的区域
快速检索
分类导航标签a
Delphi网络通信/分布式开发
JavaSUN
专题开发/技术/项目数据结构与算法
C++ BuilderAPI
JavaBorland
C/C++C++
其他数据库开发Studio Visual
扩充话题体育沙龙
Windows专区安全技术/病毒
产品/厂家英特尔信息技术峰会
C++ BuilderActiveX/COM/DCOM
WPS Office产品家族WPS二次开发及使用
其他数据库开发其他数据库
其他数据库开发数据库报表
软件培训/认证/考试软件学院
最新资讯
asp中不能查询第二个表
请教:能用jsp替换asp(脱离iis)
socket复用技术有没有朋友懂的?指点下
关于ado和access的问题
这是什么原因
一个简单的框架网页的问题
专家组帮我看看我的blog为什么总说出错了
vs2005中文件格式转换的问题--菜鸟50分
我要寻找邮件群发高手
在线等
updatedriverforplugandplaydevices声明文本
autovue-v19.1浏览控件破解版试用
ctooltipctrl标题乱码
恳求高手远程帮解解决数据库连接配置问题
如何在水晶报表中取得一部分内容?
如何修改delphi7的编辑界面风格
请问这个是什么功能 2.0*a*b/(a+b)
各位兄弟救命,100分求助,如何把下面代码改造成...
给gridview添加编号列,怎么实现啊?
出售某大型门户论坛发贴(顶贴)机源码,c#.net ...
请问哪里有问题?为什么编译会出错呢。
c#操作xml移除节点的问题
怎么样在转发前把参数存到request中去?
在此对自己近阶段的工作作一个小小总结
现在要做一个用socket传输文件夹的功能,哪位高手...
怎样利用列表框显示图片在线等。。。。好急啊。。...
asp.net调用php编写的webservice
请教个nutch的问题?
开发行业sql数据库
httpsendrequestex的使用问题!
想学asp.net不知道看什么书好。
怎么要下个东西这么难啊
mm提问:字符串处理问题,请大家帮忙,谢谢....
[闭月羞花猫]这两天怎么这么忙?
如何将窗体的大小设置成74*550呀!!!
问问大家计算机等级-三级上机c考试的问题~~~
实现口令验证程序 高手请进
在vs2003 下的<%#databinder.eval()%&g...
timestamp
高分求助.wav格式向.amr格式转换资料
热门点击
想做一个带滚动条的状态栏,最好结合ms的控件,给点...
关于tcp/ip开发的问题
找人买毕业设计·基于pda上的avi格式播放器。
如何用向oralce中插入blob数据
如何实现增加,删除dtree树的节点
中级网络工程师考什么
request.form("i")
这个程序是怎么运行的?
shellEXECute调用的外部程序如何控制?
datagridview删除行后怎么更新数据库
oracle安装的问题
dw的字段长度不能显示超过255的数据,怎么才能显...
求一个小算法
请问带复选框的树形列表怎么实现啊?!
c#数组
请问在用junit作单元测试的时候,log4j的配置文件...
自定义按钮on_wm_drawitem()消息不管用?
求一三维绘图类库
如何让parent.full.rows.indexof在ie及firefox中...
c语言怎么样才算是精通?
有办法在控件中拦截父窗口的消息吗?
又到找工作的时候了。
mshflexgrid合并单元格
四核多路至强 虚拟整合无限
招ivr工程师一名
用junit如何测试方法中的变量
两个问题,一个关于main函数,一个关于datagridv...
关于datalist和弹出新窗口的问题,求代码!
请问怎样将取得的二进制数据转换成字符串并显示在...
急救!同一个页面,在框架里操作和单独操作速度为...
内核启动时,出现解压crc error
严重bs
将在我的blog上陆续翻译karrigell相关文章,尽请...
關於日期相加問題
无法访问主域服务器,提示登录失败
一个简单的键盘输入的java小例子 求高手指点...
笔记本不能安装redhat linux 9.0,为什...
2.6内核, nptl线程库 每个线程消耗的...
setjmp()返回值问题
模2除法的结果 等于 十进制除法结果?...