数据采集

保标招标 > 数据采集 > 招标信息 > 2022年湖南体彩舆情数据多维度可视化知识挖掘服务项目

2022年湖南体彩舆情数据多维度可视化知识挖掘服务项目

· 2022-07-18

一、项目信息

项目名称:2022年湖南体彩舆情数据多维度可视化知识挖掘服务项目

项目编号:62022071876530230
项目联系人及联系方式:彭婷13787289669

报价起止时间:2022-07-18 11:06 -2022-07-21 11:06

采购单位:湖南省体育局体育彩票管理中心

供应商规模要求:-

供应商资质要求:-

供应商基本要求:满足湖南省政府采购电子卖场管理办法的供应商


二、采购需求清单

商品名称 参数要求 购买数量 控制金额(元) 意向品牌
技术测试和分析服务 核心参数要求:
商品类目: 技术测试和分析服务; 核心参数:采购需求: 一、服务时间 2022年8月1日-2022年12月15日 二、功能需求 (一)传播规律识别范围 最近几年的全网监测,范围覆盖:新闻、平媒、微博、微信、论坛、贴吧、问答、知乎、博客、平媒、APP客户端、视频(含小视频)、图片(OCR)等。 (二)可视化知识方案设置;核心参数:关键词设置界面支持思维导图模式的图形化管理,界面简单易懂,直观优雅。单个监测方案支持1000个以上(含)关键词设置,支持多层级复杂关键词设置,关键词匹配字段可选标题、正文、作者、来源、板块导航、网址、媒体名等字段,匹配方式包括但不限于全词匹配、分词匹配、正则匹配,;核心参数:支持词间距设置和位置设置(紧邻、半句、整句、段落内、整篇文章),支持关键词出现的顺序设置(设置A必须在B之前出现)、歧义词设置、排除词设置、关键词出现词频数设置(抓取至少出现N次的数据)等。;核心参数:方案支持子标签/子节点的复制和禁用等操作,可将常用规则提炼为通用知识库,多个不同方案可一键引用知识库实现快捷搭建复杂逻辑;知识库支持共有和私有库,其中公有库由系统内置,私有库由用户自行管理。其中,公有知识库要求类别齐全,规则合理,包含通用的行业规则、废文规则、广告规则、地域规则、彩票种类等内置引用功能,;核心参数:便于创建方案时便捷引用。 方案/规则创建过程中支持规则测试(便于测试当前绘制的数据模型建立是否合理,是否符合抓取要求)。支持规则/关键词导出为Excel便于本地保存和历史回查。 (三)数据观察及知识调优 1.信息预处理 自动抽取摘要信息,支持全文默认摘要、业务相关关键词摘要的个性化抽取;相似数据消重显示,同时可选择不消重查看所有数据;相似数据具体显示哪一条,;核心参数:可选最早发布、最近发布的优先级选项;支持同类型信息的聚类,可设置一条数据一对一归类、一对多归类、必选归类(如同时包含自身和竞品词,可设置必然归类或只归类到自身的选项)。 2.观察和排序 支持标题视图、全文摘要视图、关键词摘要视图,支持按发布时间、发布媒体、相似数据量等多种方式排序。 3.统计分析;核心参数:系统可对舆情信息进行即时统计分析,可选择曝光量统计、来源类型统计、正负面统计、正负面时间维度趋势统计、预警等级、TOP媒体、TOP来源(作者)、标签对比等统计情况,图表支持切换多种不同类型的图表风格(如:折线图、柱状图、曲线图、折面图、曲面图等)。 4.知识收藏 舆情数据支持知识收藏操作,支持单篇和批量收藏,可对收藏文件夹进行分组,支持多层级文件夹管理。;核心参数:5.知识调优 如果输出的数据没有体现出可识别的传媒规律,需要不断通过可视化工具对数据的可控自变量和输出调优,直到得出满意的传播规律识别。 (四)报告输出技术支撑 系统收录的数据应精准有效,可支持一键生成目标报告,达到导出即可用的目的,导出模板可个性化定制,支持Word、Excel、电脑网页、手机网页等不同形式。同时,为应对不同业务,系统数据支持类制造业的流水线操作模式:;核心参数:原始数据入库后成待加工数据供数据分析师审核,审核后的数据变为成品数据进入下一环节,同时无效数据进入废品工厂,支持对废品数据的二次利用,重新回到待加工或成品队列。此外,系统支持数据补录、数据修改(标题、作者、发布媒体、发布时间、来源、摘要、类型等可能字段),相似数据合并等操作,在成品数据基础上,支持一键生成精准化目标报告。;核心参数:(五)传播规律可视化展示 支持舆情传播规律可视化展示,可在线根据不同自变量组合定制大屏布局和展现内容,大屏风格科技感强,动静结合。可增减大屏模块,具体可选:最热数据、声量走势、资源类型统计、TOP媒体、TOP标签、舆情热力地图、关键词云等方式。 (六)热搜榜知识挖掘 实时监测各大平台热搜榜单(包括但不限于:微博热搜、百度热搜、;核心参数:头条热榜、快手热榜、知乎热榜等),支持历史热搜榜追溯,可查看热搜上榜时间、下榜时间(在榜时长)、热搜排名历史变化、热度值变化等,并以此绘制相关知识的热搜排名走势、热度走势等图表。 三、性能需求 (一)采集能力要求 1.支持以时间断点的方式增量采集; 2.支持对所有数据进行集中排重,保证数据的唯一性;排重支持不小于5亿/的日数据处理吞吐量。;核心参数:排重算法支持基于正文语义特征的排重,避免标题变种但内容相同的信息未被排重进而造成数据审核的重复工作。 3.支持数据预处理,实现采集数据的数据清洗、数据校验、数据比对、数据分类和标示、关系提取、线索提取、相似度计算、摘要提取等,支撑后端业务需要。 4.至少支持2015年至今的历史数据回溯能力,作为知识挖掘的背景数据。 5.支持多语种,多编码格式采集;;核心参数:(二)频度要求 数据采集频度默认按内容利用率动态调节,特殊网站可按需定制,最快支持分钟级采集。常见采集频度需符合以下要求: 1.社交媒体采集更新频率不低于每30分钟一次。新浪微博数据采集频率不低于每5分钟一次。 2.传统媒体采集更新频率不低于每1小时一次。 3.关键社交媒体采集周期≤10分钟。 4.一般社交媒体采集周期≤30分钟。 5.关键传统媒体采集周期≤1个小时。;核心参数:6.一般传统媒体采集周期≤5个小时。 四、服务需求 知识报告数据支撑及报告输出: 传播规律总结报告辅助输出:三年体彩领域的传播规律分析,基于历史数据及微博、头条、抖音等评论采集,并给出传播规律分析结果(格式不限)。结果报告需要识别体彩领域的独特话语及其传播规律,需要结合语义知识可视化挖掘工具和手段,结合近三年来的数据,利用自定义的多维度语义知识可视化描述和手工调优手段,;核心参数:识别出传播规律和态势,多角度剖析体彩传播数据,识别出行业、地域、经济生活分布、媒体类型、赞助活动、公众号发布等多自变量对传播的影响关系,为今后利用好新媒体、做好新传播提供知识支撑和规律指导储备。 五、其他要求: 能根据采购人的需要提供一次知识识别创建、挖掘结果人工调优和报告可视化生成的培训和指导服务。;核心参数:六、供应商资质要求 (一)满足湖南省政府采购电子卖场管理办法的供应商; (二)有体育彩票相关舆情监控经验。;描述:自媒体时代,媒体多元化传播,信息量大,形式多变,各种新的网络用语也不断出现。为识别体彩领域的独特话语及其传播规律,需要结合语义知识可视化挖掘工具和手段,结合近三年来的数据,利用自定义的多维度语义知识可视化描述和手工调优手段,;项目描述:识别出传播规律和态势,多角度剖析体彩传播数据,识别出行业、地域、经济生活分布、媒体类型、赞助活动、公众号发布等多自变量对传播的影响关系,为今后利用好新媒体、做好新传播提供知识支撑和规律指导储备。;采购需求:详见附件;
次要参数要求:
1项 70000.00 -

买家留言:提供采购需求清单的参数、相关证明资料及服务承诺书

附件:2022年湖南体彩舆情数据多维度可视化知识挖掘服务项目竞价文件.docx

响应附件要求:1.提供采购需求清单的参数、2.相关证明资料3.服务承诺书

三、收货信息

送货方式:送货上门

送货时间:工作日09:00至17:00

送货期限:竞价成交后7个工作日内

送货地址:湖南省 长沙市 芙蓉区 湘湖街道 香泽南湖大厦湖南省体育局体彩彩票管理中心

送货备注:-


四、商务要求

商务项目 商务要求
/ /



文章推荐:

中石化江汉石油工程有限公司中石化2023年套管钳及配件采购中石化2023年套管钳及配件招标公告

中国石油化工股份有限公司安庆分公司炼油转化工结构调整网格化监测系统招标公告

中铁广州工程局深大城际项目混凝土养护数据采集仪鲁班采购询价书

【海阳核电智慧工地质量管理数据采集项目监控球机设备项目】采购公告

更多商机查看,下载保标APP

扫码关注小程序,获取商机更容易