说说你遇到比较难处理的实时计算业务场景?

  • 时间:
  • 浏览:0

*互联网点击流分析:实六时析网站用户行为,精准实时把握用户画像;

*金融实时风控:实时监控金融恶意行为,实时风控除理用户损失;

*物联网IOT风控:实时监控侦测设备故障,即使除理潜在业务风险;

*电商精准推荐:实时跟踪用户行为变化,精准推荐提升产品销量。

*新华智云:项目需用实时接收来自多个渠道的数据,对原始数据进行过滤、清洗、型态化等流程除理后,将结果写入OTS、ODPS、ES等存储系统;与此一块儿,在对数据进行型态化的一块儿,需用从多个维度进行统计分析。

*小亿网络:用户画像管理系统,离线计算的最低频率是每天做一次计算。然而有或多或少标签的实时性要求是非常高的,比如问你师傅最近100分钟之内有那末操作过APP等等。运维监控系统:技术体系中,绝大每种的监控都还还可以使用阿里云的云监控来完成。也不仍有小每种是云监控无法实现的,比如接口访问量监控、短信发送失败比例监控、服务日志监控等等。

*皓量科技:AdBright项目每天会产生数十亿的业务日志数据,目前累计的数据量也达到了一百多PB,亲们的数据团队每天需用对有几个数据进行受众分析,用户标签分析,数据建模等,从而使得亲们的广告也能更精准地投放。

*凯京信达:司机通过APP提交车贷业务申请,公司大数据团队从客户申请信息、客户渠道信息、第三方征信风险数据、客户移动端实时整理的数据等维度对客户进行风险识别。其中移动端数据涉及到客户的APP操作行为、设备相关数据等,涉及到血块风控模型型态变量的实时计算大问题。

或多或少概念与离线计否有相伴而生的。

离线计算:通过 ETL 多线程 清洗上报的数据,也不把数据存入 HDFS,通过 Hadoop 的批除理 Job 把数据导入 Hive、做 ORC 压缩除理、进行数据分区,也不再通过 Presto jdbc 定时调度任务,将 Hive 数据做统计聚合至 MySQL,也不为业务人员提供数据查询、钻取和分析的功能。

实时计算:不同于批量计算结果数据需听候数据计算结果完成后,批量将数据传输到在线系统;实时计算作业在每次小批量数据计算还还可以也能立刻将数据写入在线/批量系统,不不听候整体数据的计算结果,还还可以立刻将数据结果投递到在线系统,进一步做到实时计算结果的实时化展现。

有了曾经的需求和产品定义,自然会有相关的技术实现。目前工业级别的老牌实时流计算框架是 Storm,后起之秀有 Spark Streaming,Flink 等等。

原阿里云流计算,是一套基于Apache Flink构建的一站式、高性能实时大数据除理平台,广泛应用于流式数据除理、离线数据除理、DataLake计算等场景。阿里云实时计算助力企业向实时化、智能化大数据计算升级转型。

每个大的应用场景下,全是或多或少小的具体计算需求,那末你在实时计算中遇到的具体的业务场景是?

For example:1.用户A:以购物网站为例,如保计算某网站实时uv/pv?

除了上述三件礼品外,亲们准备了20件礼品回馈给有场景需求的用户,另外也欢迎更多同学提供相关实践案例!

实时计算擅长除理的有几个领域的应用场景包括,实时的网络点击PV、UV统计;统计交通卡口的平均5分钟通过车流量;水利大坝的压力数据统计和展现;网络支付涉及金融盗窃固定行为规则的告警等。不得劲适合BI人员、大数据开发人员等用户。

大体分为五种典型场景: