-
余弦相似性:找出相似文章
所属栏目:[大数据] 日期:2021-03-18 热度:148
上一次,我用TF-IDF算法自动提取关键词。 今天,我们再来研究另一个相关的问题。有些时候,除了找到关键词,我们还希望找到与原文章相似的其他文章。比如,"Google新闻"在主新闻下方,还提供多条相似的新闻。 为了找出相似的文章,需要用到"余弦相似性"(c[详细]
-
bzoj 3110: [Zjoi2013]K大数查询(树套树,整体二分)
所属栏目:[大数据] 日期:2021-03-18 热度:144
副标题#e# 3110: [Zjoi2013]K大数查询 Time Limit:?20 Sec?? Memory Limit:?512 MB Submit:?4020?? Solved:?1547 [ Submit][ Status][ Discuss] Description 有N个位置,M个操作。操作有两种,每次操作如果是1 a b c的形式表示在第a个位置到第b个位置,每个[详细]
-
数据流和批量大数据分析技术 Apache Apex 提升为 Apache 顶级项
所属栏目:[大数据] 日期:2021-03-18 热度:136
数据流和批量大数据分析技术Apache Apex近日被Apache软件基金会提升为顶级项目。这项技术已被包括第一资本(Capital One)和通用电气(GE)在内的企业组织使用,可以帮助开发人员更快速地创建充分利用实时数据的应用程序。 Apache Spark日益受到关注,表明[详细]
-
大数加法运算
所属栏目:[大数据] 日期:2021-03-18 热度:83
void add(char a[],char b[]){/*********************装换*********************/int num1[LEN];int num2[LEN];for (int i = 0; i LEN; i++){num1[i] = 0;num2[i] = 0;}int lena = strlen(a);int lenb = strlen(b);for (int i = lena - 1,j = 0; i = 0; i-[详细]
-
图像相似性搜索的原理
所属栏目:[大数据] 日期:2021-03-18 热度:75
副标题#e# 本文转自: http://www.hackerfactor.com/blog/index.php?/archives/432-Looks-Like-It.html http://www.voidcn.com/article/p-nvcdxgfv-bnx.html http://blog.sina.com.cn/s/blog_b27f71160101gp9c.html http://www.voidcn.com/article/p-ojqegj[详细]
-
大数整除(大数mod)
所属栏目:[大数据] 日期:2021-03-18 热度:59
Description 定理:把一个至少两位的正整数的个位数字去掉,再从余下的数中减去个位数的5倍。当且仅当差是17的倍数时,原数也是17的倍数 。 例如,34是17的倍数,因为3-20=-17是17的倍数;201不是17的倍数,因为20-5=15不是17的倍数。输入一个正整数 n ,[详细]
-
FZU- Problem 1147 Tiling,递推坑题,大数水过~~
所属栏目:[大数据] 日期:2021-03-18 热度:124
副标题#e# Problem 1147 Tiling Time Limit: 1000 mSec?? ??Memory Limit : 32768 KB http://acm.fzu.edu.cn/problem.php?pid=1147 ?Problem Description In how many ways can you tile a 2x n ?rectangle by 2x1 or 2x2 tiles? Here is a sample tiling o[详细]
-
NBUT1461 数字整除(大数处理,减法、除法)
所属栏目:[大数据] 日期:2021-03-18 热度:145
数字整除 Description 定理:把一个至少两位的正整数的个位数字去掉,再从余下的数中减去个位数的5倍。当且仅当差是17的倍数时,原数也是17的倍数 。 例如,34是17的倍数,因为3-20=-17是17的倍数;201不是17的倍数,因为20-5=15不是17的倍数。输入一个正[详细]
-
轻松搞定数据处理的五款Eclipse开源工具
所属栏目:[大数据] 日期:2021-03-18 热度:162
手动处理数据的时代已经成为历史。如今科学工具正快速普及,且足以在复杂且庞大的数据处理领域帮助用户满足日益增长的需求。 立足于Eclipse富客户端平台(简称RCP)框架,多种科学工具不断涌现,旨在帮助我们在开源环境下实现数据处理与可视化。相关各企业与[详细]
-
HDU-1041-Computer Transformation,大数递推,水过~~
所属栏目:[大数据] 日期:2021-03-18 热度:121
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? Computer Transformation ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?? Time Limit: 2000/1000 MS (Java/Others) ?? ?Memory Li[详细]
-
PyTips 0x18 - 类与元类的深度挖掘 I
所属栏目:[大数据] 日期:2021-03-18 热度:192
副标题#e# 上一篇介绍了 Python 枚举类型的标准库,除了考虑到其实用性,还有一个重要的原因是其实现过程是一个非常好的学习、理解 Python 类与元类的例子。因此接下来两篇就以此为例,深入挖掘 Python 中类与元类背后的机制。 翻开任何一本 Python 教程,[详细]
-
hrbust 1582 教主与野兽【大数】
所属栏目:[大数据] 日期:2021-03-18 热度:72
? ? Description ????一天,教主在我大理工天然湖边碰见了一只野兽。 ????野兽说:我以前是一个程序员,但是被一个巫婆施了魔法变成了野兽。巫婆说如果有人看见我但是还没能解开这个诅咒,那么那个人就会变成野兽。 ????野兽继续说:其实这个诅咒挺简单的[详细]
-
【PPT+实录】携程酒店研发部BI经理潘鹏举:机器学习在OTA酒店服
所属栏目:[大数据] 日期:2021-03-18 热度:183
副标题#e# 【本文系互联网技术联盟(ITA1024)原创首发,转载或节选内容前需获授权(授权后一周以后可以转载),且必须在正文前注明:本文转自互联网技术联盟(ITA1024)技术分享实录,微信公众号:ita1024k】 潘鹏举 携程 酒店研发BI经理 互联网技术联盟 IT[详细]
-
大数据实操:如何通过打车订单判断房价是否在涨
所属栏目:[大数据] 日期:2021-03-18 热度:152
当开专车的你突然发现去房产交易中心的人多了起来,恭喜你,你的城市房价可能要涨了。 4月19日,第一财经商业数据中心(CBNData)发布的《长三角城市智能出行大数据报告》,可以告诉你这些秘密。 1 出行情况洞察楼市火爆 判断楼市是否火爆,除了看房价涨跌[详细]
-
聆听大咖 | 利用大数据分析 改变企业安全管理的被动局面
所属栏目:[大数据] 日期:2021-03-18 热度:176
副标题#e# 讲师介绍 刘定强,Hewlett Packard Enterprise 软件部大数据平台资深大数据架构师,拥有5年以上数据和MPP数据库架构设计经验;16年政府、金融行业大型核心应用架构设计和实施经验;多年Vertica、Oracle、PostgreSQL/MySQL开发管理经验。 在大数据[详细]
-
【PPT+实录】搜狗资深工程师申贤强:大数据处理和统一任务调度系
所属栏目:[大数据] 日期:2021-03-18 热度:169
副标题#e# 【本文系互联网技术联盟(ITA1024)原创首发,转载或节选内容前需获授权(授权后一周以后可以转载),且必须在正文前注明:本文转自互联网技术联盟(ITA1024)技术分享实录,微信公众号:ita1024k】 申贤强 搜狗 资深工程师 互联网技术联盟 ITA102[详细]
-
ZOJ-3380 Patchouli#39;s Spell Cards(概率DPamp;a
所属栏目:[大数据] 日期:2021-03-18 热度:167
Patchouli's Spell Cards http://acm.zju.edu.cn/onlinejudge/showProblem.do?problemId=3957 Time Limit:?7 Seconds ????? Memory Limit:?65536 KB Patchouli Knowledge,the unmoving great library,is a magician who has settled down in the Scarlet D[详细]
-
整数大数模拟 高精度加法 高精度减法 高精度乘法 高精度除法 c/c
所属栏目:[大数据] 日期:2021-03-18 热度:100
副标题#e# 描述 请计算a与b加减乘除的结果。a与b的值不超过100位,且为整数。 输入 第一行,用例数T。 第二行,整数n,(1,2,3,4)分别表示加减乘除。 第三行,整数a与b。 输出 输出a与b计算后的值。(除法只需保留整数位)。 样例输入 4 1 1 2 2 10 8 3 4 5[详细]
-
多源数据融合:大数据分析的瓶颈
所属栏目:[大数据] 日期:2021-03-18 热度:173
副标题#e# 作者:张小彦 利用互联网购物的营销数据来追踪和勾画消费行为并以此为据促销是大数据应用的成功典型案例。有些人已此将大数据吹得神乎其神,好像它能成为万能药。其实,这只是大数据应用中的很小一部分。作为智能决策的支持手段之一,大数据在企[详细]
-
技术培训 | 大数据分析处理与用户画像实践|预告
所属栏目:[大数据] 日期:2021-03-18 热度:55
主题: 大数据分析处理与用户画像实践 时间: 5 月 11 日 20:00 —— 21:30 地点: QingCloud 技术分享群,文末有二维码。 讲师: 孔淼 诸葛io 创始人 CEO 90 后连续创业者,曾任 37degree CTO ,在任 37degree CTO 期间,孔淼曾带领团队服务 CCTV 、海[详细]
-
Bi-shoe and Phi-shoe【lightoj1370】——欧拉数
所属栏目:[大数据] 日期:2021-03-18 热度:90
Bamboo Pole-vault is a massively popular sport in Xzhiland. And Master Phi-shoe is a very popular coach for his success. He needs some bamboos for his students,so he asked his assistant Bi-Shoe to go to the market and buy them. Plenty of[详细]
-
第10章-基于树的方法(1)-生成树
所属栏目:[大数据] 日期:2021-03-17 热度:191
副标题#e# 原文参考:https://onlinecourses.science.psu.edu/stat857/node/22 一,本章简介 1,本章主要学习目标 理解决策树的基本概念 理解构成决策树的三个基本元素 理解’不纯度’及其他度量公式的定义 知道如何估计每个树节点的各个所属分类的后验概率[详细]
-
数据处理1:一个中型数据的数据处理平台构建
所属栏目:[大数据] 日期:2021-03-17 热度:54
数据是这个样子的 大概一共有两万多行,我需要对每一行进行逗号的分隔解析,然后把数据重新输出 方法是把它存为文件,然后通过文件读取的方式去读取这些数据,读取一行然后进行处理让其变成单个字符串并进行显示 我这里用的是结构体存储的方法,并且分割的[详细]
-
大数据分析平台搭建教程:基于Apache Zeppelin Notebook和R的交
所属栏目:[大数据] 日期:2021-03-17 热度:124
介绍 这篇文章的目的是帮助您开始使用 Apache Zeppelin Notebook,它可以满足您用R做数据科学的需求。Zeppelin 是一个提供交互数据分析且基于Web的笔记本。方便你做出可数据驱动的、可交互且可协作的精美文档,并且支持多种语言,包括 Scala(使用 Apache S[详细]
-
四大主流开源BI商业智能平台对比评测
所属栏目:[大数据] 日期:2021-03-17 热度:109
概述:本文对主流的四款开源BI商业智能平台进行了对比,主要从三方面入手,文档、演示和架构体系。 一、文档篇 完善的文档对平台的学习和使用是非常有用的,也是判断平台是否优秀的一个最直观的方法,所以我们有理由来比较一下四个平台的文档。 openI的文[详细]