240 发简信
  • data_center之title分类

    数据中台数据清洗之title分类   物以类聚,人以群分。不同类目的商品具有不同的属性,为了方便数据存储和分析,和业务的使用需求现将产品分为如下类别:上衣、裙装、下装、包、鞋...

  • 图像检索框架

    一、简介 二、maxcomputer表结构 1、image_info 此表不是一张常驻表,在添加图片是可以用个有相关字段的表代替,只需要上传is_add设置为1的图片。 2、...

  • yaml 学习教程

    安装pyyaml yaml 数据保存 mgxx_ali.yaml 的文件格式为

  • 120
    子深odps

    dataworks 关于maxcompute maxcompute原名是odps(open-data-processing-server)就是阿里提供的一个大数据计算服务,可...

  • 120
    数据中台命名规范

    由于数据中台同一个工作空间设计多个人操作为了区分大家之间的操作的互相影响,以及更好的区分。 1、数据表的命名规范 1.1 对于学习文档表命名规范 对于文档里面的实验教程中表命...

  • 120
    data_center之打标数据清洗表设计

    数据中台数据清洗之打标数据初步清洗表结构设计   为了更好的管理数据中台数据,让数据中台数据产生更大的价值,需要将数据中台的产品属性根据打标字段的需要进行初步数据清洗,清洗以...

  • 120
  • 数据预处理

    关于数据预处理我们有3个常用的符号,数据矩阵X,假设其尺寸是[N x D](N是数据样本的数量,D是数据的维度)。均值减法(****Mean subtraction****)...

  • 简单回答

    什么是数据挖掘 数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去...

  • 120
    各种机器学习的应用场景分别是什么?例如,k近邻,贝叶斯,决策树,svm,逻辑斯蒂回归和最大熵模型

    关于这个问题我今天正好看到了这个文章。讲的正是各个算法的优劣分析,很中肯。https://zhuanlan.zhihu.com/p/25327755正好14年的时候有人做过一...

  • 120
    面试经验(机器学习)

    常见分类模型( svm,决策树,贝叶斯等)的优缺点,适用场景以及如何选型解决过拟合的方法有哪些? KNN(分类与回归) 分类模型可以做回归分析吗?反过来可以吗? 分类模型和回...

  • Nosql

    关于NoSQL与SQL的区别 随着互联网的不断发展,各种类型的应用层出不穷,所以导致在这个云计算的时代,对技术提出了更多的需求,主要体现在下面这四个方面: 低延迟的读写速度:...

  • 基于是spark-sql的农机轨迹再分析

    一、提取农机的迁移数据 1.提取每天有多少农机上线 以天为单位提取每一天农机的平均位置,用于显示每天农机的变化

  • 120
    其他按月分析

    三、农机运营分析(按月分析) 5个月农机作业轨迹数量的部分展示(统计10月份每天的作业车辆和轨迹个数) 1.运营时间与距离分析10月日均运营时间分析(日均运营时间是指该日运营...

  • S9单车分析

    一、停歇分析 1.每日停息轨迹分析 2.运营时间运营里程分析 3.作业时间作业里程分析

  • 120
  • 120
    正则学习

    正则需要在对欲检索文本的了解程度与检索精确度之间寻求平衡。如: 03.19.76 和03[-./]19[-./]76 https://www.cnblogs.com/huxi...