基础 #
模型的作用
调模型参数自动做特征工程
交互
用户数据 -> 向量化 -> 向量 -> 模型 -> 输出
算法分类
离线: 复杂模型
在线: 时间短
框架 #
tensorflow
# 神经网络计算
convnet.js
# js深度学习
scikit-learn
# python机器学习
特征工程 #
向量化, 量化才能优化, bitmap存储(位数即维数)
one-hot: 太长,无序,歧义
业务导向存储
分段标识,如年龄区间[0,1,0,0]
需要经验及产品设计
模型 #
分类
传统模型
速度快
深度模型
业务复杂, 数据量大时用
模型
线性回归
逻辑回归
朴素贝叶斯
支撑向量机
用户画像 #
在Hive中存
场景 #
聊天机器人
类型
QA机器人
闲聊机器人
任务机器人: AIOps
场景机器人
实现类型
基于检索
基于生成模型
语音识别
知识图谱
生物特征识别
AIoT
AITest
视频行为分析