Migrate server, Fun never stop !!

ปัญหาในการ migrate server
ตอน Active directory replication problem
 
ระหว่างการ migrate server,  mirror ได้พังลง เนื่องจาก harddisk มีปัญหา
ทำให้ migrate ต่อไม่ได้  (มันคงไม่โชคดีไปกว่านี้แล้วแหละ)
"Hope for the best. Expect the worst …" จริงๆ
 
พอซ่อม hardware เสร็จ ก็ต้องนั่งซ่อม ActiveDirectory replicate กันทั้งคืน
เริ่มจาก check AD replicate status
1. repadmin /showrepl
จึงรู้ว่า มันไม่ replicate เพราะมี lingering object ค้างอยู่ ไม่ยอม update
คิดย้อนกลับไปมันเกิดขึ้น เพราะ raid-1 mirror พัง แล้วสลับ harddisk กลับไปกลับมา
แล้วสุดท้ายก็ใช้ ghost image ซ่อมกลับมา run จนได้
AD มัน update Guidไปแล้ว แต่เราถอด harddisk ออก format ทิ้ง แล้วเอา image ก่อนหน้านี้ ghost เข้าไป
Guid ที่อยู่ใน image มันเป็นของเดือนที่แล้ว
พอ up ขึ้นมา AD มันก็จำ Guid อันปัจจุบัน  แต่ server กลับมี Guid ของเดือนก่อน (ไม่ sync กัน)
ทำยังไงละ ??? ซวยแล้ว
 
2. เราก็หา lingering object ที่ค้างอยู่ (Guid ที่ไม่ sync กัน) มันทำให้ server ไม่ยอมทำ inbound replication จาก windows2008 primary DC
repadmin /removelingeringobjects /advisory_mode ดูว่า object อะไรที่ค้างอยู่
เจอ TM_OSCE_server ของ trendmicro ค้างอยู่บน pdc
ลบทิ้ง แล้ว inbound replication มาจาก pdc ก็ทำงานปกติ
 
3. คราวนี้ Primary DC win2008 กลับไม่ทำ inbound replicate บ้าง
เจอ TM_OSCE_server อีกแหละ ค้างอยู่บน server ที่พัง  แต่คราวนี้ลบไม่ได้ เพราะ officeScan Corpoarte edition มัน run อยู่บน server ตัวนี้ ถ้าลบ anti-virus ทั้ง office ก็จะมีปัญหา
ก็เลย set registry  strict replication consistency เป็น 0    แล้ว PDC 2008 ก็ inbound replicate จาก server ที่พังได้
 
4. repadmin /showrepl อีกครั้ง คราวนี้ status ok.
5. dcdiag  เจอ error failed NCsecDesc บน pdc 2008 แก้โดย run  adprep /rodcprep บน 2008
rodcprep = read-only dc prepare ( read-only domain controller feature ใหม่บน 2008)
 
6. dcdiag อีกครั้ง คราวนี้ status ok.
7. แก้ registry  stict replication consistency กลับเป็น 1
 
8. check ว่ามีปัญหา usn rollback หรือเปล่า  repadmin /showUTDvec  *  dc=domain-name,dc=com
เจอ usn id มีการ rollback เกิดขึ้น
netlogon serive paused ของมันเอง , windows time service stop ด้วย
ลบ registry Dsa Not Writable”=dword:00000004 ทิ้ง
AD replication ก็ทำงานปกติตามเดิม
 
9. check LTO tape drive  event log RSM id 94 , rsm database import failed.
ต้องลบ database ของเดิมทิ้ง แล้วให้มัน initialize database จาก 0
ไฟ cleaning flag set โชว์ ต้องล้างหัวอ่าน ด้วย cleaning tape.
 
10. reboot server แล้ว ทำ dynamic disk, add mirror ทิ้งไว้ให้มัน sync ของมันเอง
 
หมดห่วงแล้ว นอนหลับ สบายใจ
 
 
 
dcdiag error NCsecDesc on windows2008
http://support.microsoft.com/kb/967482
 
จากข้างบน  ยากก็ตรงการหาวิธีแก้ไขนี่แหละ
พอรู้วิธี ก็พิม command สองสามบรรทัด ใช้เวลาไม่ถึง 5 นาที จบ
แต่เวลาที่ใช้ในการค้นคว้า เกือบ 10 ชั่วโมง
This entry was posted in Uncategorized. Bookmark the permalink.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s