没有找到合适的产品?
联系客服协助选型:023-68661681
提供3000多款全球软件/控件产品
针对软件研发的各个阶段提供专业培训与技术咨询
根据客户需求提供定制化的软件开发服务
全球知名设计软件,显著提升设计质量
打造以经营为中心,实现生产过程透明化管理
帮助企业合理产能分配,提高资源利用率
快速打造数字化生产线,实现全流程追溯
生产过程精准追溯,满足企业合规要求
以六西格玛为理论基础,实现产品质量全数字化管理
通过大屏电子看板,实现车间透明化管理
对设备进行全生命周期管理,提高设备综合利用率
实现设备数据的实时采集与监控
利用数字化技术提升油气勘探的效率和成功率
钻井计划优化、实时监控和风险评估
提供业务洞察与决策支持实现数据驱动决策
原创|其它|编辑:郝浩|2010-01-18 10:43:30.000|阅读 689 次
概述:假设我们的会员管理系统有一个排行榜的功能,需要每隔一段时间就对系统中的所有会员(假设会员数有100万)的积分进行排序,然后对其中的前100名进行某些奖励。
# 界面/图表报表/文档/IDE等千款热门软控件火热销售中 >>
1.缘起:
假设我们的会员管理系统有一个排行榜的功能,需要每隔一段时间就对系统中的所有会员(假设会员数有100万)的积分进行排序,然后对其中的前100名进行某些奖励。
这是一个典型的TopN算法――对巨大数量的对象进行排序,然后只需要取出最Top的前N名(N比对象总数小很多),作为排行榜的数据。
解决这样的问题,我们要注意一点,如果我们每次都对所有的对象进行完全排序,那无疑效率非常低下,而且非常不划算。因为我们只需要前N名,而不是所有对象的先后顺序。
我设计了ESBasic.ObjectManagement.TopNOrderedContainer来解决排行榜算法,TopNOrderedContainer只将资源花费在真正需要计算的地方,另外,TopNOrderedContainer支持在运行过程中,将不断新产生的对象加入到排行榜。
2.适用场合:
TopNOrderedContainer用于对巨大数量的对象进行TopN排序。其适用场合有如下特点:
(1)需要被排序的对象的数量非常巨大(如几百万、甚至几千万)。
(2)对系统有价值的排序结果只有前N名。
(3)N远小于总的对象数量。
3.设计思想与实现
TopNOrderedContainer的排行榜算法的思路是这样的,使用一个长度为N的数组,来存放最Top的N个对象,越Top的对象其在数组中的Index就越小。这样,每次加入一个对象时:
(1)首先,判断当前的排行榜的最后一名是否比新加入的对象更Top,如果是则丢弃它。
(2)其次,看新加入的对象是否比当前排行榜的第一名更Top,如果是,则新的对象应该被放置在index为0的位置。
(3)否则,就采用二分查找算法为新加入的对象找到合适的位置,并调整排行榜中位于插入位置后面的对象的位置。
当然,在具体实现的源码中,我们看到了还有一些边界条件的处理这里没描述出来。
TopNOrderedContainer的类图如下所示:
我们看到TopNOrderedContainer有一个泛型参数TObj,它是进行排序的对象的类型。TObj的泛型约束表明TObj必须实现IOrdered接口。IOrdered接口定义如下:
关于这个接口要注意两点:
第一,该接口的唯一方法的名字为什么不是类似IsGreaterThan、IsSmallerThan等,而是IsTopThan?因为不同的应用有不同的需求,有的可能是要选择前N个最大的,有的是要选择前N个最小的,甚至有的可能选择前N个最著名的,等等。而IsTopThan可以覆盖所有这些情况,反正都是最Top的N个嘛。
第二,IOrdered接口之所以使用泛型参数TOrderedObj,是为了避免派生类在实现IsTopThan方法时,需要将参数other的类型进行向下转换。
现在我们在回到TopNOrderedContainer,关于其实现要注意以下几点:
(1)排行榜容器可以在多线程的环境中使用。TopNOrderedContainer使用SmartRWLocker来对Add方法进行同步,之所以选择读写锁而不是简单的lock,是因为使排行榜容器在应对多读/少写的状况时能支持更大的并发。
(2)排行榜的生成采用的是插入排序策略,排序的具体算法是二分查找排序。Adjust方法的实现就是二分查找算法的体现。
(3)GetTopN方法用于返回当前的排行榜的拷贝。之所以返回一个拷贝,是因为外部对返回的数组进行任何操作都不会影响到TopNOrderedContainer的内部集合。
(4)为何不将TopN排序直接实现为一个静态方法?如果以静态的方式实现,那我们就没有办法继续动态的Add新的对象进入排行榜,即使要达到这样的目的,也就只有构造新的list,再次调用static GetTopN方法,如此就浪费了前面的计算成果。
4. 使用时的注意事项
如果要排序的对象的数量与TopN的N值的差距并不大,那么使用TopNOrderedContainer并不一定是最佳的选择,这时我们可以采用一些高效的完全排序算法对所有的对象进行排序,然后再取出前N名,可能速度会更快。
当然,我们也可以使用最大最小堆的算法来实现TopN的排序,也是完全可行的。
5.扩展
TopN排行榜容器TopNOrderedContainer暂时没有任何扩展。
本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@evget.com
文章转载自:博客园面对“数字中国”建设和中国制造2025战略实施的机遇期,中车信息公司紧跟时代的步伐,以“集约化、专业化、标准化、精益化、一体化、平台化”为工作目标,大力推进信息服务、工业软件等核心产品及业务的发展。在慧都3D解决方案的实施下,清软英泰建成了多模型来源的综合轻量化显示平台、实现文件不失真的百倍压缩比、针对模型中的大模型文件,在展示平台上进行流畅展示,提升工作效率,优化了使用体验。
本站的模型资源均免费下载,登录后即可下载。模型仅供学习交流,勿做商业用途。
本站的模型资源均免费下载,登录后即可下载。模型仅供学习交流,勿做商业用途。
本站的模型资源均免费下载,登录后即可下载。模型仅供学习交流,勿做商业用途。
服务电话
重庆/ 023-68661681
华东/ 13452821722
华南/ 18100878085
华北/ 17347785263
客户支持
技术支持咨询服务
服务热线:400-700-1020
邮箱:sales@evget.com
关注我们
地址 : 重庆市九龙坡区火炬大道69号6幢
慧都科技 版权所有 Copyright 2003-
2025 渝ICP备12000582号-13 渝公网安备
50010702500608号