华为 技术介绍

数据源: 用缓冲kafka等,缓解存储层的压力->缓存层->存储层(HBASE适合实时查询,Hive适合批处理,OpenStore适合海量数据(华为内部))->计算层(Spark Storm,兼顾UI可视化界面)->智慧层(算法,结合业务)

面向大量用户,使用同一套Hadoop平台,需要资源调度+任务调度

Yarn是Hadoop的资源管理

HDFS 和 MySQL 一般并列,数据整合

ES主要用来查询,Redis做缓冲层,一般后端从Redis查,没有再从MySQL中查,然后备份给Redis

FTRL 推荐系统中最广泛的算法 C++,不知道有没有Spark

数据层

数据获取最难,

Spring boot 配置项,数据库名称等,改文件即可

离线推荐,并发量小直接从MySQL中取,实时计算从后端接口取

Spark没有提供RESTful接口

前后端同学都要了解RESTful API,看这两页就可以
https://restfulapi.net/
https://restfulapi.net/resource-naming/

有同学反应之前发的Java EE教程太长,对应的实体书360还是3600页,我筛选了一下比较重要该看的:

所有里面涉及到JSF (JavaServer Faces),Facelets,JSP的都跳过别看

(可选,了解Java EE总体框架和主要模块组件API有哪些) https://javaee.github.io/tutorial/overview.html 其中Web Services Support和GlassFish Server Tools别看

资源与依赖注入 https://javaee.github.io/tutorial/injection.html https://javaee.github.io/tutorial/partcdi.html (看Chap.25,其他以后查阅)

Web Application https://javaee.github.io/tutorial/webapp001.html https://javaee.github.io/tutorial/webapp002.html https://javaee.github.io/tutorial/servlets.html (看前三节了解一下,后面需要再查阅) https://javaee.github.io/tutorial/jaxrs.html https://javaee.github.io/tutorial/jaxrs-advanced.html (了解,以后查阅)

EJB https://javaee.github.io/tutorial/partentbeans.html (看Chap.35-36,其他以后查阅)

JPA https://javaee.github.io/tutorial/partpersist.html (看Chap.40,其他以后查阅)

0%