久久无码高潮喷水抽搐,极品馒头泬19p,久久人人爽精品玩人妻av,精品国产成人国产在线视,精品视频一区二区三区在线观看

最新更新最新專題

您的位置:首頁 > ppt下載 > PPT課件 > 課件PPT > 大數(shù)據數(shù)據挖掘ppt

大數(shù)據數(shù)據挖掘ppt下載

素材大小:
1 MB
素材授權:
免費下載
素材格式:
.ppt
素材上傳:
lipeier
上傳時間:
2020-01-09
素材編號:
249369
素材類別:
課件PPT

素材預覽

大數(shù)據數(shù)據挖掘ppt

這是大數(shù)據數(shù)據挖掘ppt,包括了大數(shù)據平臺生態(tài)系統(tǒng),應用與研究,軟件著作權,大數(shù)據是什么?數(shù)據挖掘是什么,解決方案-比賽任務等內容,歡迎點擊下載。

大數(shù)據數(shù)據挖掘ppt是由紅軟PPT免費下載網推薦的一款課件PPT類型的PowerPoint.

基于大數(shù)據平臺的數(shù)據挖掘的研究與應用 曹水根 研究與應用 賽題背景: 阿里巴巴旗下電商擁有海量的買家和賣家交易場景下的數(shù)據。利用數(shù)據挖掘技術,我們能對未來的商品需求量進行準確地預測,從而幫助商家自動化很多供應鏈過程中的決策。這些以大數(shù)據驅動的供應鏈能夠幫助商家大幅降低運營成本,提升用戶的體驗,對整個電商行業(yè)的效率提升起到重要作用。 解決方案-比賽任務 評測成本: 在本賽題中,參賽者需要提供對于每個商品在未來兩周的全國最優(yōu)目標庫存和分倉區(qū)域最優(yōu)目標庫存的預測。我們會提供每一個商品的補少成本(A)和補多成本(B),然后根據用戶預測的目標庫存值跟實際的需求的差異來計算總的成本。參賽者的目標是讓總的成本最低。 解決方案-比賽任務 賽題數(shù)據: 我們提供商品從20141010到20151227的全國和區(qū)域分倉數(shù)據。參賽者需給出后面兩周(20151228-20160110)的全國和區(qū)域分倉目標庫存。 商品在全國的特征包括商品的本身的一些分類:類目、品牌等,還有歷史的一些用戶行為特征:瀏覽人數(shù)、加購物車人數(shù),購買人數(shù)。注意我們要預測的未來需求是“非聚劃算支付件數(shù)”(qty_alipay_njhs)。 數(shù)據預處理 采樣與過濾 加權采樣: 以加權方式生成采樣數(shù)據;權重列必須為double或int類型,按照該列的value大小采樣;如col的值是1.2和1.0;則value=1.2所屬樣本的被采樣的概率就大一些。 隨機采樣: 以隨機方式生成采樣數(shù)據,每次采樣是各自獨立的。 過濾與映射: 對數(shù)據按照過濾表達式進行篩選。"過濾條件"中填寫where語句后面的sql腳本即可;"映射規(guī)則"可以rename字段名稱。 分層采樣 : 根據用戶指定的分組字段分層采樣樣本 數(shù)據合并 JOIN: 類似sql join的功能,將兩張表通過一個字段關聯(lián)合成一張表;同時用戶可以rename輸出的字段名稱 合并列: 將兩張表的數(shù)據按列合并,需要表的行數(shù)保持一致,否則報錯。 UNION: 類似sql union的功能,將兩張表的數(shù)據按行合并,左、右表選擇輸出的字段保持完全一致;"去重"是union,不"去重"是union all。 增加序列號 在數(shù)據表第一列追加ID列。 缺失值填充 忽略元組 人工填寫缺失值 使用全局常量(如Unknown)填寫缺失值 使用屬性的中心度量(如均值或者中位數(shù))填充缺失值 使用與給定元組屬同一類的所以樣本的屬性均值或中心值 使用最可能的值填充缺失值 拆分 按照比例拆分樣本集,如設置0.6,切分成60:40兩個樣本集 歸一化 min-max 標準化 也稱為離差標準化,是對原始數(shù)據的線性變換,使結果值映射到[0 - 1]之間。轉換函數(shù)如下: 其中max為樣本數(shù)據的最大值,min為樣本數(shù)據的最小值。這種方法有個缺陷就是當有新數(shù)據加入時,可能導致max和min的變化,需要重新定義。 標準化 Z-score標準化方法 這種方法給予原始數(shù)據的均值(mean)和標準差(standard deviation)進行數(shù)據的標準化。經過處理的數(shù)據符合標準正態(tài)分布,即均值為0,標準差為1,轉化函數(shù)為: 結合賽題的實際情況所做的一些具體的數(shù)據預處理步驟 特征工程 菜鳥-需求預測與分倉規(guī)劃項目的特征工程 特征變換 特征變換 隨機森林 特征重要性評估 特征重要性評估 特征選擇與生成 統(tǒng)計分析 機器學習 機器學習 機器學習 機器學習 機器學習 機器學習 評估 評估 軟件著作權 總結 1、找工作要早作準備 2、大數(shù)據工作類型IrY紅軟基地

數(shù)據挖掘課件ppt:這是數(shù)據挖掘課件ppt,包括了華院分析公司簡介,華院分析為客戶提供數(shù)據挖掘整體解決方案,華院分析團隊介紹,在中國移動集團內部的主要工作介紹,虛增放號與不穩(wěn)定的用戶群體進一步增大了銷售成本等內容,歡迎點擊下載。

數(shù)據挖掘ppt王燦:這是數(shù)據挖掘ppt王燦,包括了電子商務與數(shù)據挖掘——完美結合,電子商務為數(shù)據挖掘提供海量數(shù)據,豐富的記錄信息,“干凈的數(shù)據”,投資收益容易衡量,對電子商務網站的Web數(shù)據挖掘,Web Usage Mining的作用,Web Usage Mining的基本過程,課后思考等內容,歡迎點擊下載。

大數(shù)據挖掘ppt:這是大數(shù)據挖掘ppt,包括了數(shù)據挖掘概覽,數(shù)據預處理,分類(Classification),聚類(Cluster),關聯(lián)規(guī)則(Association Rule),回歸(Regression)等內容,歡迎點擊下載。

PPT分類Classification

Copyright:2009-2024 紅軟網 rsdown.cn 聯(lián)系郵箱:rsdown@163.com

湘ICP備2024053236號-1