您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > IBM系列AIX小型机巡检项目及流程参考
IBM系列AIX小型机巡检项目及流程参考链接:站内相关文章|RelatedArticlesAIX系统中PVID的含义与作用vim全局替换命令参考如何在shell脚本里使用sftp批量传送文件IT人物之-惠普CEOMarkHurdIBMAIXsvmon简介之一1、机器型号#uname-uMIBM,7029-6E3IBM,01100550A2、检查系统硬件设备故障灯是否有亮3、系统错误报告#errpt-dH-TPERM//硬件的错误报告IDENTIFIERTIMESTAMPTCRESOURCE_NAMEDESCRIPTIONBFE4C0250530085308PHsysplanar0UNDETERMINEDERRORBFE4C0250529091308PHsysplanar0UNDETERMINEDERROR#errpt-dS-TPERM//软件的错误报告#errpt-aj*******|more//具体的错误信息#errpt-dH-TPERM/tmp/hwerror.log//可以把错误的报告存成一个文件4、有否给root用户的错误报告#mailMail[5.2UCB][AIX5.X]Type?forhelp./var/spool/mail/root:5messages3new5unreadU1rootThuMay1509:5324/884diagelamessagefromp615U2rootFriMay1604:0724/884diagelamessagefromp615N3rootSatMay2413:0823/874diagelamessagefromp6155、检查hacmp.out,smit.log,bootlog等#lssrc-gcluster/#lssrc-gclusterSubsystemGroupPIDStatusclstrmgrEScluster16334active一般上hacmp.out的位置:/usr/sbin/cluster/或者/tmp/然后找到最近的hacmp.out文件,察看有没有错误信息6、文件系统检查#df-kFilesystem1024-blocksFree%UsedIused%IusedMountedon/dev/hd413107210156823%22684%//dev/hd214417923125698%3605611%/usr/dev/hd9var13107211704811%4182%/var看看有没有超过90%使用率的,建议用户改善7、逻辑卷有否stale的状态#lsvg-lrootvgLVNAMETYPELPsPPsPVsLVSTATEMOUNTPOINThd5boot111closed/syncdN/Ahd6paging441open/syncdN/Ahd8jfslog111open/syncdN/Ahd4jfs111open/syncd/hd2jfs11111open/syncd/usrhd9varjfs111open/syncd/var如果系统还有其他卷组,也需要察看8、内存交换区的使用率是否超过70%#lsps-aPageSpacePhysicalVolumeVolumeGroupSize%UsedActiveAutoTypehd6hdisk0rootvg512MB1yesyeslv9、系统性能是否有瓶颈#topas#vmstat110kthrmemorypagefaultscpu---------------------------------------------------------------rbavmfrerepipofrsrcyinsycsussyidwa001100294086180000004602750199000110031408616000000156254109900011003140861600000036288400990#iostat110tty:tintoutavg-cpu:%user%sys%idle%iowait0.0394.00.00.0100.00.0Disks:%tm_actKbpstpsKb_readKb_wrtnhdisk00.00.00.000hdisk10.00.00.000cd00.00.00.00010、网络与通讯检查#ifconfig-a#netstat-inNameMtuNetworkAddressIpktsIerrsOpktsOerrsCollen01500link#20.9.6b.3e.6.ac1964053400en01500192.168.0192.168.0.111964053400lo016896link#1267041300lo016896127127.0.0.1267041300#netstat-rn//察看路由情况RoutingtablesDestinationGatewayFlagsRefsUseIfExpGroupsRouteTreeforProtocolFamily2(Internet):127/8127.0.0.1U7142lo0--192.168.0.0192.168.0.11UHSb00en0--=#vi/etc/hosts//察看hosts文件有否特殊的定义#ping****#lsattr-Elinet0//路由的检测authm65536AuthenticationMethodsTruehostnameh24HostNameTruegatewayGatewayTrueroutenet,,0,172.16.23.81RouteTruebootup_optionnoSerialOpticalNetworkInterfaceTruerout6FDDINetworkInterfaceTrue11、有否符合要求的系统备份第一次去可以先询问客户关于备份的策略#ls-l/image.data//看看系统有没有备份的image文件,记录最后备份日期-rw-r--r--1rootsystem9600May1917:31/image.data#lsvg-lrootvg//察看有否符合要求的数据备份和保护LVNAMETYPELPsPPsPVsLVSTATEMOUNTPOINThd4jfs111open/syncd/hd2jfs11111open/syncd/usrhd10optjfs111open/syncd/optoraclelvjfs2801601open/syncd/oracleloglv00jfs2log111open/syncdN/Atestlvjfs10201closed/syncd/tmp/test如何察看数据保护方式RAID10/RAID5,RAID的Hotspare属性是否打开#smittyssaraid?Change/ShowAttributesofanSSARAIDArray检查EnableUseofHotSpares属性是否为YES12、系统Dump设置是否正确#sysdumpdev-lprimary/dev/hd6secondary/dev/sysdumpnullcopydirectory/var/adm/rasforcedcopyflagTRUEalwaysallowdumpFALSEdumpcompressionOFF#sysdumpdevPp/dev/hd6s/dev/sysdumpnull#sysdumpdev-P-c13、HACMP测试#/usr/sbin/cluster/diag/clconfig-v'-tr'//ClusterVerification输出结果无Fail#/lssrc-gcluster14、maxpout,minpout系统参数如果系统中运行了HACMPsmittychgsysy,将High/Lowwatermark从0/0修改为33/24#lsattr-Elsys0|grepmaxpout//maxpout用途:对文件指定未决I/O的最大数目值:缺省值:0(不检查);范围:0到n(n应该是4的倍数加1)#lsattr-Elsys0|grepminpout//指定一个基点,在该基点处,已达到maxpout的程序可以继续写入文件值:缺省值:0(不检查);范围:0到n(n应该是4的倍数,且大于或等于4小于maxpout)15、syncd参数#grepsyncd/sbin/rc.boot//sync()被syncd调用的间隔时间nohup/usr/sbin/syncd10/dev/null2&1&值:缺省值:60;范围:1到任何正整数显示:grepsyncd/sbin/rc.boot或vi/sbin/rc.boot更改:更改在下次引导后有效,而且是永久有效。备用方法是使用命令kill来终止守护程序syncd并用命令/usr/sbin/syncdinterval从命令行重新启动它。诊断:当syncd正在运行时,文件的I/O被阻塞了。调整:在缺省级别上,这个参数几乎不影响性能。不推荐对这个参数进行更改。为了保持数据完整性对于HACMP而使syncdinterval明显缩小,会导致性能下降。更改命令为:#vi/sbin/rc.boot16、aio参数//异步I/O可调参数#lsdev-C|grepaio察看状态是否是available#lsattr-Elaio0minservers1MINIMUMnumberofserversTruemaxservers10MAXIMUMnumberofserversTruemaxreqs4096MaximumnumberofREQUESTSTruekprocprio39ServerPRIORITYTrueautoconfigavailableSTATEtobeconfiguredatsystemrestartTruefastpathenableStateoffastpathTrue#smitaio//可以更改参数17、检查errdaemon,srcmstr是否正常运行#ps-ef|greperr#ps-ef|grepsrc18、系统硬件诊断#diag-DiagnosticRoutines-SystemVerification-AllResources-F7或者Esc+719、补丁程序PTF是否满足要求,当前系统补丁版本#oslevel-r5300-04#instfix-i|grepAllfilesetsfor5.3.0.0_AIX_MLwerefound.Allfilesetsfor5300-01_AIX_MLwerefound.Allfilesetsfor5300-02_AIX_MLwerefound.Allfilesetsfor5300-03_AIX_MLwerefound.Allfilesetsfor5300-04_AIX_MLwerefound.Allfilesetsfor5300-05_AIX_MLwerefound.#lscfg-vp//检查所有设备的微码20、收集系统信息放到/tmp/ibmsupt#snap-ac//运行#snap-ac,生成文件snap+s/n.pax.Z
三七文档所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
本文标题:IBM系列AIX小型机巡检项目及流程参考
链接地址:https://www.777doc.com/doc-3719288 .html