当前位置: 首页 > news >正文

python网站开发入门超级外链工具

python网站开发入门,超级外链工具,酒店网站html,知名自适应网站建设哪家好前几天发现一个有趣的文章 “40亿个QQ号,限制1G内存,如何去重?”,发现很有意思,就想着用代码实现一下,下面是分析和实现过程 一、审题分析 一个 QQ 号现在最长有 11 位,因为 int 是四字节,数值范围是2的31次方,因此得使用 long 存储,但考虑到实现,使用 int 存储(1…

前几天发现一个有趣的文章 “40亿个QQ号,限制1G内存,如何去重?”,发现很有意思,就想着用代码实现一下,下面是分析和实现过程

一、审题分析

  • 一个 QQ 号现在最长有 11 位,因为 int 是四字节,数值范围是2的31次方,因此得使用 long 存储,但考虑到实现,使用 int 存储(10位QQ);
  • 40亿 QQ 文件存储至少在 4000000000 * 4(字节) / 1024 / 1024 / 1024 ~= 14.9G, 所以不可能将文件全部加载到内存中;
  • 在进行去重时需要将之前的记录存储在内存中,上面分析到如果将QQ全部存储是不可能的,通过将 40亿QQ 分到不同文件中,但实际也是绕不过存储到内存中,分成多个文件只能加快读取(多线程读取),怎么办呢?
  • 仔细探究了一番,之前我们做项目的时候,为了去除百万级的数据重复问题,我们用了布隆过滤器;这次这个问题的话,需要从它下手。想了想它的原理“存在,可能存在;不存在,一定不存在”。得从“位”下手。假设40亿QQ都不重复,将每个QQ 看作是一个数值,有一个数组,数组中每个值是 1 位,一个 QQ 号就是一个 Index, 数组的下标,存在则将 Index 对应的值设置为 1 ,不存在则是 0,算一下大小,4000000000 * 1(位) / 8 / 1024 / 1024 / 1024 ~= 0.48G ,算完这个队列可以呀,不到 1g&#x
http://www.wooajung.com/news/532.html

相关文章:

  • 日本做暧小视频在线观看网站百度灰色词排名代发
  • 介绍家乡的网站怎么做全球外贸b2b网站
  • 如何做Google外贸网站线上营销推广
  • 广州做网站谷歌 google
  • 网站用什么字体做正文个人如何做seo推广
  • 临沂做网站好的公司怎么做游戏推广员
  • 一家专门做爆品印刷的网站7月新闻大事件30条
  • 自己做的网站怎么添加文档公众号推广合作平台
  • 在线制作网站公章百度上如何发广告
  • 安徽省建设厅官方网站免费b站推广网站在线
  • 建设银行北京市分行网站南宁网络推广软件
  • wordpress 优酷通用代码自适应seo刷网站
  • 登录门户网站百度竞价在哪里开户
  • 初创企业的建站流程哈尔滨seo网络推广
  • wordpress 外贸网站建设简述什么是seo及seo的作用
  • 国外免费网站建设百度网盘网址是多少
  • 手机投资理财网站建设青岛做网络推广的公司有哪些
  • 网站建设 南京河北疫情最新情况
  • 重庆网站建设公司排名宁波网站seo公司
  • 永久免费云服务器无需注册北京seo经理
  • 建设凡科网站神马搜索seo优化排名
  • 专门做招商的网站是什么情况网址信息查询
  • 企业网站优化方案的策划腾讯营销平台
  • 手机网站模板欣赏百度搜索广告怎么收费
  • 网站建设建站经验怎么制作公司网页
  • 网站建设期间注意事项wp博客seo插件
  • 怎样看一个网站是不是织梦做的seo的形式有哪些
  • window主机用wordpress淘宝seo是什么
  • 国外做的好的网站百度投诉中心在线申诉
  • 手机做wifi中继上外国网站百度推广计划