故障現(xiàn)象
隨著5G網(wǎng)絡(luò)的快速部署,SA網(wǎng)絡(luò)已逐步實(shí)現(xiàn)商用,隨著日常SA用戶(hù)的不斷增加,相關(guān)網(wǎng)絡(luò)指標(biāo)的監(jiān)控已成為5G網(wǎng)絡(luò)日常重點(diǎn)工作,通過(guò)指標(biāo)觀測(cè)及時(shí)發(fā)現(xiàn)潛在問(wèn)題點(diǎn),以保障用戶(hù)良好的網(wǎng)絡(luò)使用體驗(yàn)。目前,SA接通率有RRC建立、QoSflow、NG建立三部分決定,其中任何指標(biāo)出現(xiàn)問(wèn)題,接通率均存在惡化風(fēng)險(xiǎn)。通過(guò)前期的SA指標(biāo)監(jiān)控,對(duì)其存在的問(wèn)題進(jìn)行分析與解決,并將其處理經(jīng)驗(yàn)進(jìn)行了總結(jié),通過(guò)本案例以希望為后期優(yōu)化提供一定的參考價(jià)值。
故障分析
故障分析流程如圖1所示。
圖1 故障分析流程圖Counter分析
Counter分析受限需要對(duì)問(wèn)題進(jìn)行定界,優(yōu)先判斷是否存在核心網(wǎng)問(wèn)題和傳輸問(wèn)題,若存在問(wèn)題,需聯(lián)合核心網(wǎng)和傳輸側(cè)共同分析,待上層問(wèn)題排除后再觀察指標(biāo)是否恢復(fù)。若沒(méi)有恢復(fù)再繼續(xù)分析無(wú)線(xiàn)側(cè)問(wèn)題。Counter分析主要從以下4個(gè)方面著手。
RRC建立失敗原因分析
RRC建立成功率=RRC建立成功次數(shù)/RRC建立請(qǐng)求次數(shù)(包含重發(fā))
網(wǎng)管定義了以下幾種RRC建立失敗原因:
小區(qū)中RRC建立請(qǐng)求拒絕的次數(shù):Gnb收到Msg3后,需要為終端分配無(wú)線(xiàn)資源,SRB1資源等,當(dāng)出現(xiàn)分配失敗時(shí),則會(huì)回復(fù)RRCConnectionReject。
RRC建立失敗常見(jiàn)原因:
小區(qū)中由于UE無(wú)應(yīng)答導(dǎo)致RRC建立失敗的次數(shù):Gnb下發(fā)Msg4后,一直未收到終端上發(fā)的Msg5。UE無(wú)應(yīng)答導(dǎo)致的RRC建立失敗絕大多數(shù)是由于弱覆蓋或干擾引起的,可以通過(guò)RF優(yōu)化,干擾處理解決。
小區(qū)中由于流控導(dǎo)致的RRC建立請(qǐng)求消息丟棄的次數(shù):當(dāng)CPU負(fù)荷過(guò)高時(shí),為防止系統(tǒng)崩潰,會(huì)啟動(dòng)流控,限制用戶(hù)接入。CPU負(fù)荷過(guò)高,主要由于基站負(fù)荷過(guò)高導(dǎo)致,需要及時(shí)處理高負(fù)荷問(wèn)題,另外尋呼風(fēng)暴&信令風(fēng)暴等問(wèn)題也會(huì)導(dǎo)致CPU負(fù)荷增高,需要額外關(guān)注。
網(wǎng)管側(cè)可以統(tǒng)計(jì)到小區(qū)中因資源分配失敗導(dǎo)致RRC建立拒絕的次數(shù)的counter。
NG口SIG建立失敗原因分析
對(duì)于NG口信令建立失敗,網(wǎng)管未定義失敗counter,通常有以下幾種原因:
核心網(wǎng)原因:AMF收到Initial UE Message后不回復(fù)或直接將終端釋放,此種情況需要聯(lián)合核心網(wǎng)排查。
基站問(wèn)題:Gnb收到Msg5后處理異常,沒(méi)有上發(fā)Initial UE Message,此種情況需結(jié)合具體信令消息進(jìn)行定位。
傳輸問(wèn)題:NG口SIG建立或上下文建立流程中,出現(xiàn)傳輸中斷導(dǎo)致流程失敗,此種情況需要聯(lián)合傳輸處理。
NAS過(guò)程異常:NAS過(guò)程異常,AMF主動(dòng)釋放或AMF不發(fā)送上下文建立請(qǐng)求或Gnb釋放,此種建議聯(lián)合核心網(wǎng)排查。
上下文建立失敗原因分析
網(wǎng)管定義了以下上下文建立失敗原因:
無(wú)線(xiàn)層原因?qū)е碌腢E上下文建立失敗:空口問(wèn)題,通常由弱覆蓋或干擾導(dǎo)致,可以通過(guò)RF優(yōu)化與干擾排查處理。
無(wú)線(xiàn)資源不足導(dǎo)致的UE上下文建立失敗:通常由高負(fù)荷引起,需要及時(shí)處理,如無(wú)高負(fù)荷問(wèn)題,需進(jìn)行單用戶(hù)信令跟蹤定位問(wèn)題。
UE無(wú)響應(yīng)導(dǎo)致的UE上下文建立失?。和瑹o(wú)線(xiàn)層原因。
核心網(wǎng)異常導(dǎo)致的UE上下文建立失敗:跟蹤信令,查看問(wèn)題節(jié)點(diǎn)后進(jìn)行處理。
QoSFlow建立失敗原因分析
對(duì)于QosFlow建立失敗,PRS有如下原因值:
UE能力導(dǎo)致的QosFlow建立失?。航K端問(wèn)題,建議提單處理。
傳輸網(wǎng)絡(luò)層原因?qū)е碌腝osFlow建立失?。郝?lián)合傳輸排查。
核心網(wǎng)原因?qū)е碌腝osFlow建立失?。郝?lián)合核心網(wǎng)排查。
無(wú)線(xiàn)網(wǎng)絡(luò)層原因?qū)е碌腝osFlow建立失敗:空口原因,通過(guò)RF優(yōu)化與干擾排查處理。
故障處理
硬件故障
硬件故障首先要識(shí)別斷站、退服和影響業(yè)務(wù)的故障,并梳理出相應(yīng)的故障目錄。并對(duì)故障發(fā)生時(shí)間和恢復(fù)時(shí)間與指標(biāo)劣化時(shí)間點(diǎn)進(jìn)行匹配,若存在強(qiáng)相關(guān)性,才認(rèn)為該硬件故障是導(dǎo)致指標(biāo)劣化的主要因素。一旦明確其相關(guān)性,需盡快推動(dòng)維護(hù)盡快處理。5G影響業(yè)務(wù)和退服類(lèi)告警清單梳理常見(jiàn)表1。
干擾排查
對(duì)采集的干擾話(huà)統(tǒng),計(jì)算時(shí)間特征、頻域特征、符號(hào)時(shí)域特征、空域特征,通過(guò)特征提取、聚類(lèi)可得出對(duì)干擾特征的推斷。時(shí)間上每天統(tǒng)計(jì)8~22點(diǎn)15忙時(shí)按算術(shù)平均,任何一天干擾大于門(mén)限值(默認(rèn)-107dBm/PRB)認(rèn)為干擾小區(qū)。
NR鄰區(qū)終端干擾
相鄰?fù)l小區(qū)上行PRB分配碰撞帶來(lái)的干擾如圖2所示。
圖2 NR鄰區(qū)終端干擾
屏蔽器干擾
信號(hào)屏蔽器通過(guò)發(fā)射無(wú)用功率對(duì)基站的干擾,常見(jiàn)于學(xué)校、政企、監(jiān)獄等,如圖3所示。
圖3 屏蔽器干擾
建議從組內(nèi)最強(qiáng)小區(qū)開(kāi)始外部干擾排查,重點(diǎn)排查周邊的學(xué)校、政企、監(jiān)獄等單位,學(xué)校、政企等短時(shí)間使用的建議協(xié)調(diào)“用完就關(guān)”,監(jiān)獄等長(zhǎng)期開(kāi)啟類(lèi)建議推動(dòng)更換“只干擾下行”的屏蔽器
外部干擾
外部干擾一般呈現(xiàn)出區(qū)域相關(guān)性,此處定義的外部干擾可能是非已知的外部干擾源,需要外出用頻譜分析儀進(jìn)行干擾源定位建議從組內(nèi)最強(qiáng)小區(qū)開(kāi)始外部干擾排查,根據(jù)干擾特征,使用三點(diǎn)定位法定位干擾源位置。
偽基站干擾
公安等的仿真基站設(shè)備與運(yùn)營(yíng)商基站幀頭未對(duì)齊的干擾,如圖4所示。
圖4 偽基站干擾
建議從組內(nèi)最強(qiáng)小區(qū)開(kāi)始外部干擾排查,重點(diǎn)排查路邊、重要路口的路燈桿等上的射頻設(shè)備,建議推動(dòng)修改幀頭與運(yùn)營(yíng)商對(duì)齊。
覆蓋優(yōu)化
覆蓋優(yōu)化一般優(yōu)先考慮現(xiàn)場(chǎng)RF優(yōu)化,再考慮波束優(yōu)化。覆蓋優(yōu)化需建立在經(jīng)緯度、方位角、機(jī)/電傾角準(zhǔn)確的基礎(chǔ)上。主要采取功率整治和波束調(diào)優(yōu)兩種手段。
功率整治
總體原則:功率配置過(guò)高,對(duì)下行速率有增益,但由于終端上行發(fā)射功率受限,會(huì)導(dǎo)致上行下不平衡。功率配置偏低,不利于話(huà)務(wù)吸收,分流效果較差?,F(xiàn)按照廠家功率建議進(jìn)行功率規(guī)整。
波束調(diào)優(yōu)
波束調(diào)優(yōu)主要采用RF調(diào)整和Pattern尋優(yōu)相結(jié)合的方式,使小區(qū)覆蓋最大程度合理化。具體優(yōu)化手段如下:
5GNR廣播信號(hào)引入調(diào)制參考信號(hào),通過(guò)窄波束輪詢(xún)掃描,多個(gè)廣播窄波束組合成不同覆蓋范圍,相比LTE寬波束,增益有~9dB的提升。
5GNR廣播波束最大支持17種波束場(chǎng)景。根據(jù)宏微站產(chǎn)品規(guī)格能力,并綜合4/5G網(wǎng)絡(luò)需求,結(jié)合路測(cè)及ACP自動(dòng)調(diào)優(yōu)平臺(tái),智能輸出RF優(yōu)化方案。
容量?jī)?yōu)化
5G目前無(wú)容量類(lèi)問(wèn)題,若存在個(gè)別5G高負(fù)荷小區(qū),可參考LTE高負(fù)荷的優(yōu)化方法,優(yōu)先采取負(fù)載均衡措施進(jìn)行優(yōu)化。
參數(shù)鄰區(qū)優(yōu)化
參數(shù)優(yōu)化包括常規(guī)基線(xiàn)參數(shù)核查和特性參數(shù)優(yōu)化兩類(lèi)。鄰區(qū)優(yōu)化主要包括鄰區(qū)漏配、鄰區(qū)錯(cuò)配、冗余鄰區(qū)和PCI混淆等方面。
故障總結(jié)
隨著日常SA用戶(hù)的不斷增加,為保障用戶(hù)良好的網(wǎng)絡(luò)使用體驗(yàn),相關(guān)網(wǎng)絡(luò)指標(biāo)的監(jiān)控已成為5G網(wǎng)絡(luò)日常重點(diǎn)工作,以便及時(shí)發(fā)現(xiàn)潛在問(wèn)題點(diǎn)。通過(guò)前期的SA指標(biāo)監(jiān)控,發(fā)現(xiàn)SA的無(wú)線(xiàn)接通率低于正常值,結(jié)合定位影響接通指標(biāo)的原因,給出了接通率的優(yōu)化思路、分析方法、定位手段,以及優(yōu)化效果,為后續(xù)優(yōu)化提供一定的參考。