农村强奸一级网站|久草京热在线视频|色五月桃花综合激情|亚洲人妻精品主播|欧美无限码中文在线|国产午夜伦理三级|亚洲男女在线播放|欧美日韩成人香蕉视频|全球无码AV1区|中文字幕亚洲五月

投資企業(yè)新聞

星環(huán)科技利用大數(shù)據(jù)分析提升垃圾短信過(guò)濾效果

2015/09/02 | 轉(zhuǎn)自:星環(huán)科技

 

客戶背景

通信發(fā)展伴生的弊端

移動(dòng)通信技術(shù)的不斷發(fā)展之下,短信已經(jīng)成為人們生活中不可或缺的工具之一,但伴隨而來(lái)的垃圾短信泛濫,不但占用了電信運(yùn)營(yíng)商寶貴的網(wǎng)絡(luò)資源,而且給人們的生活、工作帶來(lái)了無(wú)盡的煩惱。如何對(duì)垃圾短信進(jìn)行智能識(shí)別與實(shí)時(shí)監(jiān)測(cè),從而提高客戶滿意度與服務(wù)質(zhì)量,成為了當(dāng)前電信行業(yè)亟待解決的問(wèn)題。

不斷加劇的垃圾短信問(wèn)題

在通訊信息技術(shù)不斷發(fā)達(dá)的當(dāng)今社會(huì),短信作為一種直達(dá)用戶,成本低廉的方式,不但被越來(lái)越多的商業(yè)公司用于促銷或宣傳目的,甚至成為不法分子實(shí)施詐騙的重要手段。中國(guó)信息產(chǎn)業(yè)部報(bào)告顯示,2014年,全國(guó)移動(dòng)短信業(yè)務(wù)量7630.5億條,而垃圾短信的數(shù)量就占了1/4左右,這些造成了對(duì)用戶的騷擾甚至財(cái)產(chǎn)損失的垃圾短信問(wèn)題正在變得越來(lái)越嚴(yán)重。

面臨挑戰(zhàn)

增強(qiáng)垃圾短信檢測(cè)手段:挖掘垃圾短信的隱藏信息,利用更新的技術(shù)手段,提升垃圾短信防范效率。

提高垃圾短信檢測(cè)精度:傳統(tǒng)單純以字符串匹配過(guò)濾垃圾短信的方法誤檢率較高,而且事后增加關(guān)鍵詞的手段存在滯后性。

實(shí)時(shí)監(jiān)測(cè):對(duì)短信實(shí)時(shí)監(jiān)測(cè)并完成垃圾短信的過(guò)濾,不斷降低垃圾短信到達(dá)率,提高用戶滿意度。

解決方案

部署垃圾短信實(shí)時(shí)監(jiān)測(cè)平臺(tái):基于分布式消息隊(duì)列Kafka和流處理引擎實(shí)現(xiàn)實(shí)時(shí)的垃圾短信判斷和預(yù)警。同時(shí),結(jié)合人工確認(rèn)垃圾短信數(shù)據(jù),加入訓(xùn)練集用于機(jī)器自動(dòng)學(xué)習(xí),垃圾短信判斷準(zhǔn)確率99.9%以上。

垃圾短信實(shí)時(shí)監(jiān)測(cè)平臺(tái),實(shí)現(xiàn)垃圾短信的實(shí)時(shí)過(guò)濾:針對(duì)短信數(shù)據(jù)24小時(shí)不間斷產(chǎn)生、大規(guī)模、高并發(fā)等特點(diǎn),星環(huán)科技基于Transwarp Stream流處理計(jì)算框架研發(fā)垃圾短信實(shí)時(shí)監(jiān)測(cè)平臺(tái),短信數(shù)據(jù)通過(guò)實(shí)時(shí)消息隊(duì)列進(jìn)入計(jì)算集群,利用事先訓(xùn)練好的模型完成數(shù)據(jù)轉(zhuǎn)換、特征提取、分析及實(shí)時(shí)判斷預(yù)警等復(fù)雜計(jì)算。模型判斷出的垃圾短信會(huì)通過(guò)人工確認(rèn),人工判斷確實(shí)為垃圾短信的數(shù)據(jù)會(huì)加入訓(xùn)練集用于模型的迭代訓(xùn)練。

星環(huán)科技垃圾短信實(shí)時(shí)監(jiān)測(cè)平臺(tái)流程圖

流計(jì)算引擎實(shí)現(xiàn)實(shí)時(shí)垃圾短信過(guò)濾:測(cè)試員模擬典型的短信發(fā)送場(chǎng)景,對(duì)10萬(wàn)條短信數(shù)據(jù)集連續(xù)測(cè)試兩小時(shí)。測(cè)試結(jié)果顯示,每服務(wù)器節(jié)點(diǎn)每秒鐘可對(duì)1000-3000條短信實(shí)施過(guò)濾計(jì)算,正常短信和垃圾短信的識(shí)別率均在99.9%以上。

星環(huán)科技工程師程大偉說(shuō):“在垃圾短信實(shí)時(shí)監(jiān)測(cè)平臺(tái)中,網(wǎng)絡(luò)適配器不但是短信數(shù)據(jù)傳輸至流處理引擎的通道,而且是影響整個(gè)平臺(tái)性能的瓶頸,需要在90%以上高負(fù)荷的情況下保持?jǐn)?shù)據(jù)傳輸?shù)姆€(wěn)定性。”

部署垃圾短信實(shí)時(shí)監(jiān)測(cè)平臺(tái)后,垃圾短信在到達(dá)用戶之前即被實(shí)時(shí)過(guò)濾,而機(jī)器學(xué)習(xí)的機(jī)制可以不斷根據(jù)短信內(nèi)容調(diào)整或更新訓(xùn)練模型?!帮@然,垃圾短信到達(dá)率的降低將幫助運(yùn)營(yíng)商提高用戶的滿意度。此外,運(yùn)營(yíng)商可以根據(jù)短信規(guī)模靈活調(diào)整計(jì)算集群的服務(wù)器數(shù)量滿足過(guò)濾需求,更重要的是,運(yùn)營(yíng)商原來(lái)被垃圾短信占用的網(wǎng)絡(luò)資源被釋放,運(yùn)營(yíng)商可借此改進(jìn)業(yè)務(wù)運(yùn)營(yíng)?!背檀髠パa(bǔ)充到。

實(shí)施效果

提高用戶滿意度:99.9%以上的垃圾短信被自動(dòng)過(guò)濾,通信公司的用戶對(duì)垃圾短信的抱怨和投訴率顯著降低,提高其用戶滿意度。

提升網(wǎng)絡(luò)資源利用率:運(yùn)營(yíng)商將垃圾短信占用的網(wǎng)絡(luò)資源用于其它短信業(yè)務(wù),改進(jìn)短信業(yè)務(wù)市場(chǎng)運(yùn)營(yíng)。

實(shí)時(shí)垃圾短信監(jiān)控:通過(guò)對(duì)垃圾短信的實(shí)時(shí)監(jiān)控和持續(xù)的機(jī)器自動(dòng)學(xué)習(xí)手段,不斷滿足越來(lái)越復(fù)雜的垃圾短信管理和過(guò)濾需求。

提高垃圾短信過(guò)濾效率和精度:電信運(yùn)營(yíng)商根據(jù)垃圾短信的內(nèi)容整理出特定的關(guān)鍵詞,在短信到達(dá)用戶前,利用字符串匹配的方式在數(shù)據(jù)中心實(shí)施計(jì)算和過(guò)濾。

“這種基于字符串匹配的手段存在明顯的不足。首先是滯后性,運(yùn)營(yíng)商只能在事后整理關(guān)鍵詞,然而發(fā)送垃圾短信的用戶會(huì)不斷的測(cè)試關(guān)鍵詞并調(diào)整短信內(nèi)容,例如:加入特殊符號(hào)、利用同音漢字等等,這使得依靠整理和分析關(guān)鍵詞的方式實(shí)現(xiàn)垃圾短信過(guò)濾效果越來(lái)越差?!背檀髠フf(shuō):“其次,伴隨關(guān)鍵詞的數(shù)量不斷增加,服務(wù)器的計(jì)算性能對(duì)垃圾短信過(guò)濾效率影響越來(lái)越大?!?/p>

此外,對(duì)于電信運(yùn)營(yíng)商而言,這些垃圾短信的傳送占用和浪費(fèi)了大量寶貴的網(wǎng)絡(luò)資源。

電信運(yùn)營(yíng)商急需利用更新的技術(shù)手段對(duì)海量短信數(shù)據(jù)實(shí)現(xiàn)實(shí)時(shí)運(yùn)算和分析,挖掘出有價(jià)值的垃圾短信參考依據(jù),形成機(jī)器學(xué)習(xí)的機(jī)制,實(shí)現(xiàn)自動(dòng)化的垃圾短信過(guò)濾,從而充分利用網(wǎng)絡(luò)資源,并提高用戶滿意度。

星環(huán)科技流處理引擎提供強(qiáng)大的流計(jì)算表達(dá)能力,支持在流數(shù)據(jù)上進(jìn)行實(shí)時(shí)事件檢測(cè)和批處理、機(jī)器學(xué)習(xí)等復(fù)雜的計(jì)算邏輯,是電信運(yùn)營(yíng)商提高垃圾短信防范的理想工具。

目標(biāo)與展望

下一步,星環(huán)科技將和電信運(yùn)營(yíng)商深入合作,繼續(xù)挖掘短信發(fā)送用戶和接受用戶之間的關(guān)系,利用圖的方法進(jìn)一步提升垃圾短信過(guò)濾效率和質(zhì)量。