High Bandwidth from nutch

ช่วงอาทิตย์ที่ผ่านมานี้มีเหตุการผิดปรกติบางอย่างเกิดขึ้นกับเว็บผมครับ คือว่าอยู่ดีๆ bandwidth ที่แสดงถึงอัตราการ download / upload ข้อมูลของเว็บผมพุ่งสูงขึ้นไปจนถึง 6GB ต่อเดือน และล่าสุดขึ้นไปถึง 9GB แล้ว ซึ่งทำให้ผมตกใจกับเหตุการณ์นี้มาก เพราะปรกติแล้วในแต่ละเดือนผมจะเสีย bandwidth ประมาณแค่ 2 – 3 GB ต่อเดือน ประมาณนี้ และที่ webhostdd ที่ผมเช่าอยู่ใน plan กำหนดไว้ไม่ให้เกิน 4 GB ต่อเดือน ซึ่งก็เพียงพออยู่สำหรับเว็บเล็กๆ อย่าง chokelive.com ของผม ซึ่งเหตุการนี้เป็นไปได้อย่างไร น่าสงสัยมาก ผมเลยจัดการสืบสารเรื่องราวจนได้ข้อสรุปมาดังต่อไปนี้

เมื่อเข้าไปดูที่ stat ที่แล้ว ก็สังเกตเห็นว่า จำนวนคนเข้าจะมามากในช่วงวันที่ 12 พฤษจิกายน เป็นต้นมา ดังกราฟแสดงการใช้งานเว็บข้างล่างนี้

ซึงจะสังเกตเห็นว่าอัตราการดาวน์โหลดข้อมูลจะสูงกว่าการใช้งานระดับปรกติมากครับ เมื่อเทียบกับก่อนวันที่ 12 (สังเกตที่กราฟสีแดง) แต่เมื่อดูที่กราฟสีส้มซึ่งแสดงถึงอัตราการเข้าชมเว็บ ก็เป็นอัตราปรกติ แสดงว่าจำนวนคนเข้าชม เป็นปรกติ แต่มีบางอยากเข้ามากิน bandwidth เว็บผมได้อย่างไร

เลยจัดการไปตรวจดู hostname ที่เข้ามากิน bandwidth เว็บผมอันดับหนึ่งนั่นก็คือ 203.146.127.155 ซึ่งผมก็ไม่รอช้า เข้าไปดู IP ตัวนี้โดยผ่านเว็บแล้วกลายเป็นเว็บปล่อย bot ตัวหนึ่งเพื่อเข้ามาเก็บข้อมูลตามเว็บไซต์ต่างๆ คล้ายๆ กับ bot ของ google นั่นแหละครับ

และเว็บนี้ใช้ชื่อว่า nutch ซึ่งรายละเอียดบอกว่าเป็นเว็บที่ตั้งขึ้นมาเพื่อหาข้อมูลเกี่ยวกับ open sorce

ครับ เมื่อได้คำตอบของต้นปัญหาแล้ว จึงอยากจะวิจารณ์ บ้างนะครับ ว่าเว็บนี้ สร้างความเดือดร้อนให้ผมเป็นอย่างมาก ซึ่งการปล่อย bot มาเก็บข้อมูลตามเว็บไซต์ต่างๆ เป็นเรื่องที่ดี ผมสนับสนุนครับ เพราะจะได้เป็นการ promote เว็บผมไปด้วยในตัว แต่ควรจะทำระบบให้ดีสักหน่อย อย่างของ google นี่ เข้ามากิน bandwidth ผมแค่ 4-5 % ต่อเดือนเอง แต่เว็บ nutch เข้ามากินไป 70% กว่าๆ ซึ่งมากกว่าจำนวนผู้เข้าชมเว็บไซต์ในแต่ละเดือนของผมซะอีก

แล้วแบบนี้ผมจะได้อะไรบ้างครับ กับ bandwidth ที่ผมต้องเสียไป อีกทั้งเว็บ nutch ก็ใช้งานอะไรไม่ได้เลยสักอย่าง (ค้นแล้ว error ตลอด) ถ้าเกิดว่า bandwidth ผมเกินแล้ว ทำให้เว็บผมต้องถูก ปิดไปสำหรับเดือนนี้ หรือทำให้ผมต้องเสียเงินค่า bandwidth ส่วนที่เกินเพิ่ม โดยที่ผมไม่ได้อะไรเลย คุณจะรับผิดชอบไหม ขอประจานความผิดพลาด อันนี้ให้กับเว็บที่มีชื่อว่า nutch ด้วยครับ

สุดท้ายนี้ต้องขอขอบคุณทาง webhostdd.com ด้วยนะครับ ที่ไม่คิดเงินค่า bandwidth ส่วนที่เกินเพิ่มกับผม เพราะเป็นเหตุสุดวิสัยจริงๆ และขอบคุณด้วยที่ช่วย block IP 203.146.127.155 ไม่ให้เข้ามาก่อกวนและสร้างความเดือดร้อนให้กับเว็บผมและเว็บอื่นๆ ใน host แห่งนี้ครับ ขอบคุณครับ

1 thought on “High Bandwidth from nutch”

  1. มีคนอย่างนี้ด้วยอ่ะ

    อาจมา comement ช้าไป เพราะตอนนี้กำลังทำรายงานเกี่ยวกับ Traffic อยู่ พอดี ก็อข้อมูลไปลงในรายงานหน่อยนะค๊ะ

    เอ่อ ขอแค่ที่จำเป็นต้องใช้ไม่ใช่ทั้งหมมดนะค๊ะ ขอบคุณ มาก ๆ สำหรับเนื้อหานี้ ได้ความรู้เพิ่มเติมเลย

    Reply

Leave a Reply to illiilli Cancel reply