您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 资本运营 > srio调试过程和错误的基本判决
最近发现论坛上好多SRIO的帖子,刚好应客户需求我总结了一些SRIO的东西,在这里也分享出来,作为抛砖引玉吧。首先坦白来说我不是太懂SRIO,至少SRIO协议我没完全看过,O(∩_∩)O~,为了给客户写这些东西,我也查阅了很多资料和书籍,如果有不对的地方,欢迎大家讨论和指正。(论坛上的SRIO大虾很多,比如Zhan,Allen等,嘿嘿……)SRIO其实不是个通用的名字,真正能google到的叫Lp-serial,这个全称是什么暂且买个关子,它是一种协议,就是规定了两个都遵照这种协议的设备可以通信。要注意的是这里规定的是两个设备,不是三个也不是四个,这个理解是比较重要的。比如你一个switch连接了3个DSP和2个FPGA,这5个都可以通过SRIO协议通信的。但是本质上,这3个DSP和2个FPGA都是和Switch通信,再进一步来说这个协议是端到端的协议。之所以要说明这个问题,就是很多客户反映的DSP到FPAG发包木有成功,如果中间有switch,那么你需要检查DSP到switch的链路,switch到FPGA的链路。而不是笼统的去看DSP到FPGA,这就是协议的本质。再说协议,协议规定了SRIO在物理层传递是按照固定的报文的。如果你是做原始的SRIO的IP,那么你需要手动的拼接这些报文;如果你用TI芯片,恭喜你,TI使用LSU帮你拼接,你只需要配置LSU寄存器就可以了。所以有人问LSU怎么填,那么如果你懂了协议里面的包格式,同时了解LSU如何对应到协议中去,那么你就不会有任何疑问了。(这当然是说的简单啊……)继而就说到SRIO的错误检测了,通常遇到SRIO错误,我们这里抛去硬件信号质量错误(这种错误需要看眼图)。我们一般首先会看offset为0x158的SPn_ERR_STAT寄存器。比特位域如下表所示,这个寄存器可以分为3个部分来看,一是port状态,二是输出和输出的stoperror,三是重传的stoperror。我们下面分三部分重点说明各个状态是什么意义。BitNameDescription0Port_Uninitialized输入和输出端口未初始化,bit0和bit1是互斥的,在同一时刻有且只有1个bit为1(硬件自动设置和清除)1Port_Ok输入和输出端口已经被初始化完成,且双方互相发送error-free控制符号(硬件自动设置和清除)2Port_Error输入或者输出端口遇到一个硬件无法恢复的错误,主要是指link-response未收到或者收到错误response4Port_Write_Pnd端口要求发起一个port-write的维护操作告知对端错误状态。Port-write的接收方式是预先定义好的,当出现端口错误的时候就会往该方发送port-write的维护报文8Input_Error_STP输入端口检测到一个传输错误(硬件自动设置和清除)9Input_Error_ENC输入端口曾经检测到一个传输错误,随着bit8的置位而置位,写1可清除10Input_Retry_STP输入端口进入重传停止状态16Output_Error_STP输出端口检测到一个传输错误(硬件自动设置和清除)17Output_Error_ENC输出端口曾经检测到一个传输错误,随着bit16的置位而置位,写1可清除18Output_Retry_STP输出端口进入重传停止状态(硬件自动设置和清除)19Output_Retried输出端口重传标志,随着bit18设置而置位,写1可清除20Output_Retry_Enc输出口曾经处于输出重传状态24Output_Degrd_Enc输出端口的degraded错误数达到或者超过门限值25Output_Fail_Enc输出端口的Failed错误数达到或者超过门限值26Output_Pkt_Drop输出端口丢弃一个包(只对Switch设备)PortuninitializedandPortOk端口未初始化和端口OK是一组状态,端口状态只能是未初始化或者OK。通常在刚开始的时候端口状态时未初始化的,需要用户进行初始化配置才能变成端口OK状态。端口的初始化配置主要是端口的接收时钟窗对齐以及端口宽度的确认过程;大部分情况端口宽度通常是固定配置的,只有接收时钟窗需要调整。接收时钟窗调整的过程是,两个连接的设备都互相向对方不停的发送trainingcontrolsymbol和link-requestcontrolsymbol。成功收到并检测出controlsymbol的端口会回复一个idlecontrolsymbol,收到idlecontrolsymbol的端口会清除portuninitialized状态转为portok状态。InputandOutputErrorStop输入和输出停止错误是成双成对存在的错误发生场景:设备A给设备B发送报文设备B发现接收到的idle控制符号或者报文错误,那么设备B进入inputerrorstop状态(该bit置1,同时inputerrorencounter也置位)。设备B发送PNA(packet-not-accpet)控制符号给设备A设备A收到PNA后停止发送任何消息,备份当前发送失败的消息并进入outputerrorstop状态(该bit置1,同时outputerrorencounter也置位)。错误恢复场景:前提:设备A处于outputerrorstop,设备B处于inputerrorstop设备A发送link-request给设备B设备B回应link-response给设备A,并清除inputerrorstop状态设备A收到link-response,清除outputerrorstop状态。设备A继续发送上次未成功报文或者发送优先级更高的报文InputandOutputRetryStop输入和输出重传错误是成双成对存在的错误发生场景:设备A给设备B发送报文设备B发现一些临时问题导致不能接收报文(比如没有空闲buffer可以接收),那么设备B丢弃该报文,进入inputretrystop状态(该bit置1,同时inputretryencounter也置位)。设备B发送PR(packet-retry)控制符号给设备A设备A收到PR后停止发送任何消息,备份当前发送失败的消息并进入outputretrystop状态(该bit置1,同时outputretryencounter也置位)。错误恢复场景:前提:设备A处于outputretrystop,设备B处于inputretrystop设备A发送restart-from-retry给设备B设备B收到restart-from-retry后,清除inputerrorstop状态并开始接收报文设备A清除outputretrystop状态,继续发送上次未成功报文或者发送优先级更高的报文需要指出的是,这个寄存器是SRIO错误状态判断的最基本的寄存器,还有更高级的东东,可惜我也是一知半解,下次学习了再分享吧!
三七文档所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
本文标题:srio调试过程和错误的基本判决
链接地址:https://www.777doc.com/doc-2860539 .html