Marketing & Digital marketing

วิธีใช้แมชชีนเลิร์นนิงเพื่อการวิจัยคู่แข่ง SEO

ด้วยความกระหายที่เพิ่มมากขึ้นของผู้เชี่ยวชาญด้าน SEO เพื่อ เรียนรู้ Python ไม่เคยมีช่วงเวลาไหนที่จะดีหรือน่าตื่นเต้นไปกว่านี้อีกแล้ว ใช้ประโยชน์จากความสามารถของแมชชีนเลิร์นนิง (ML) และนำไปใช้กับ SEO

โดยเฉพาะอย่างยิ่งในการวิจัยคู่แข่งของคุณ

ในคอลัมน์นี้ คุณจะได้เรียนรู้ว่าแมชชีนเลิร์นนิงช่วยจัดการกับความท้าทายทั่วไปในการวิจัยคู่แข่ง SEO ได้อย่างไร วิธีตั้งค่าและฝึกโมเดล ML ของคุณ วิธีทำให้การวิเคราะห์เป็นแบบอัตโนมัติ และอื่นๆ

เริ่มทำสิ่งนี้กัน!

เหตุใดเราจึงต้องการเรียนรู้ของเครื่องในการวิจัยคู่แข่ง SEO

ส่วนใหญ่ถ้าไม่ใช่ SEO ทั้งหมด ผู้เชี่ยวชาญที่ทำงานในตลาดที่มีการแข่งขันสูงจะวิเคราะห์ SERP และคู่แข่งทางธุรกิจของพวกเขาเพื่อค้นหาว่าไซต์ของพวกเขากำลังทำอะไรอยู่เพื่อให้ได้อันดับที่สูงขึ้น

ย้อนกลับ 1231 เราใช้สเปรดชีตเพื่อรวบรวมข้อมูลจาก SERP โดยมีคอลัมน์ที่แสดงถึงแง่มุมต่างๆ ของการแข่งขัน เช่น จำนวนลิงก์ไปยังโฮมเพจ จำนวน หน้า ฯลฯ

เมื่อมองย้อนกลับไป แนวคิดนั้นถูกต้อง แต่การดำเนินการนั้นสิ้นหวังเนื่องจากข้อจำกัดของ Excel ในการดำเนินการวิเคราะห์ที่มีประสิทธิภาพทางสถิติในเวลาอันสั้น

โฆษณา

  • อ่านต่อด้านล่าง

    และหากขีดจำกัดของสเปรดชีตไม่เพียงพอ ภูมิทัศน์ได้เคลื่อนไปค่อนข้างมากตั้งแต่นั้นมา อย่างที่เราเป็น:

    ข้างต้นไม่ได้หมายถึงรายการแนวโน้มที่ครบถ้วนสมบูรณ์ แต่ใช้เพื่อแสดงให้เห็น -การเพิ่มช่วงของปัจจัยที่สามารถอธิบายข้อได้เปรียบของคู่แข่งที่มีอันดับสูงกว่าของคุณใน Google

    การเรียนรู้ของเครื่องในบริบท SEO

    โชคดีที่มีเครื่องมือเช่น Python/R เราไม่อยู่ภายใต้ข้อจำกัดของสเปรดชีตอีกต่อไป Python/R สามารถจัดการข้อมูลได้หลายล้านถึงหลายพันล้านแถว

    หากมีสิ่งใด ขีดจำกัดคือคุณภาพของข้อมูลที่คุณสามารถป้อนลงในโมเดล ML ของคุณและคำถามอันชาญฉลาดของคุณ ขอข้อมูลของคุณ

    ในฐานะผู้เชี่ยวชาญด้าน SEO คุณสามารถสร้างความแตกต่างที่ชัดเจนให้กับแคมเปญ SEO ของคุณโดยตัดเสียงรบกวนและ

    โดยใช้การเรียนรู้ของเครื่อง กับข้อมูลของคู่แข่งเพื่อค้นหา:

    โฆษณา
  • อ่านต่อด้านล่าง

  • ปัจจัยการจัดอันดับใดที่สามารถอธิบายความแตกต่างในการจัดอันดับระหว่างไซต์ได้ดีที่สุด
  • เกณฑ์มาตรฐานที่ชนะคืออะไร
  • ค่าหน่วยที่เปลี่ยนแปลงในปัจจัยมีค่าเท่าใดในแง่ของอันดับ

    เช่นเดียวกับความพยายามทางวิทยาศาสตร์ (ข้อมูล) มี จำนวนคำถามที่ต้องตอบก่อนที่เราจะสามารถเริ่มเขียนโค้ดได้

    ประเภทอะไร ของ ML Problem is Competitor Analysis?

     

    ML แก้ปัญหาต่างๆ ไม่ว่าจะเป็นการจัดหมวดหมู่ สิ่งของ (การจัดประเภท) หรือการทำนายจำนวนต่อเนื่อง (การถดถอย)

    ในกรณีของเราโดยเฉพาะเนื่องจากคุณภาพของ SEO ของคู่แข่งแสดงด้วยอันดับใน Google และนั่น อันดับเป็นตัวเลขต่อเนื่อง ดังนั้นปัญหา ML คือหนึ่งในความถดถอย

    Outcome Metric
     

    เนื่องจากเรารู้ว่าปัญหา ML เป็นหนึ่งในการถดถอย ตัวชี้วัดผลลัพธ์คืออันดับ มีเหตุผลหลายประการ:

    • อันดับจะไม่ได้รับผลกระทบจากฤดูกาล อันดับของแบรนด์ไอศกรีมสำหรับการค้นหา จะไม่เสื่อมราคาเพราะเป็นฤดูหนาวซึ่งแตกต่างจากเมตริก "ผู้ใช้"
    • อันดับของคู่แข่งเป็นข้อมูลของบุคคลที่สามและพร้อมใช้งานโดยใช้เครื่องมือ SEO เชิงพาณิชย์ ซึ่งแตกต่างจากการเข้าชมและ Conversion ของผู้ใช้

    คุณสมบัติคืออะไร?

    เมื่อทราบเมตริกผลลัพธ์แล้ว เราต้องกำหนดตัวแปรอิสระหรืออินพุตโมเดลที่รู้จักด้วย เป็นคุณสมบัติ ชนิดข้อมูลสำหรับคุณลักษณะนี้จะแตกต่างกันไป เช่น

    สีแรกวัดเป็นวินาทีจะเป็นตัวเลข
      ความรู้สึกที่มีหมวดหมู่เชิงบวก เป็นกลาง และเชิงลบ จะเป็นปัจจัยหนึ่ง

    โดยปกติแล้ว คุณต้องครอบคลุมคุณลักษณะที่มีความหมายมากที่สุดเท่าที่จะเป็นไปได้ รวมทั้งด้านเทคนิค เนื้อหา/UX และนอกสถานที่ให้ได้มากที่สุด การวิจัยคู่แข่งอย่างครอบคลุม

    คณิตศาสตร์คืออะไร?

    เนื่องจากการจัดอันดับเป็นตัวเลข และเราต้องการอธิบายความแตกต่างของอันดับ แล้วใช้เงื่อนไขทางคณิตศาสตร์ :

    อันดับ ~ w_1*feature_1 + w_2*feature_2 + … + w_n*feature_n

    ~ (รู้จักกันในชื่อ “ตัวหนอน” ) หมายถึง "อธิบายโดย"

    n เป็นคุณลักษณะที่ n

    w คือน้ำหนักของคุณลักษณะ

    การใช้การเรียนรู้ของเครื่อง เพื่อเปิดเผยความลับของคู่แข่ง

    ด้วยคำตอบสำหรับคำถามเหล่านี้ เราพร้อมที่จะดูว่าแมชชีนเลิร์นนิงสามารถเปิดเผยความลับใดเกี่ยวกับคู่แข่งของคุณได้

    ณ จุดนี้ เราจะถือว่าข้อมูลของคุณ (ที่รู้จักในตัวอย่างนี้ว่า “serps_data”) ได้เข้าร่วม แปลงสภาพ ทำความสะอาด และพร้อมสำหรับการสร้างแบบจำลองแล้ว

    โฆษณา

  • อ่านต่อด้านล่าง

    อย่างน้อยที่สุด ข้อมูลนี้จะมี Google ข้อมูลอันดับและคุณลักษณะที่คุณต้องการทดสอบ

    ตัวอย่างเช่น คอลัมน์ของคุณอาจมี:

  • Google_rank.
  • Page_speed.
  • ความรู้สึก.
  • Flesch_kincaid_read ing_ease.

  • Amp_version_available.
  • Site_depth.
  • Internal_page_rank.
  • จำนวนผู้อ้างอิง
  • avg_domain_authority_backlinks.
  • title_keyword_string_distance.

    การฝึกโมเดล ML ของคุณ

    ในการฝึกโมเดลของคุณ เราใช้ XGBoost เพราะมีแนวโน้มที่จะให้ผลลัพธ์ที่ดีกว่ารุ่น ML อื่นๆ

    ทางเลือกอื่นที่คุณอาจต้องการทดลองใช้แบบคู่ขนานคือ LightGBM (โดยเฉพาะสำหรับชุดข้อมูลที่ใหญ่กว่ามาก), RandomForest และ Adaboost

    ลองใช้ Python ต่อไปนี้ รหัสสำหรับ XGBoost สำหรับชุดข้อมูล SERP ของคุณ:

    # นำเข้าไลบรารี

     นำเข้า xgboost เป็น xgb นำเข้าแพนด้าเป็น pd serps_data = pd.re  ad_csv('serps_data.csv') 

    # ตั้งค่าตัวแปรโมเดล

    # ข้อมูล SERP ของคุณมีทุกอย่าง ยกเว้นคอลัมน์ google_rank

    serp_features = serps_data.drop(คอลัมน์ = ['Google_rank'])

    # ข้อมูล SERP ของคุณด้วยคอลัมน์ google_rank

    rank_actual = serps_data.Google_rank

    # ยกตัวอย่างโมเดล

     serps_model = xgb .XGBRegressor(วัตถุประสงค์='reg:เชิงเส้น', random_state=1024)

    # พอดีกับรุ่น

    serps_model.fit(serp_features, rank_actual)

    # สร้างการคาดการณ์แบบจำลอง

    rank_pred = serps_model.predict(serp_features)

    # ประเมิน กินความถูกต้องของแบบจำลอง

     mse = mean_squared_error(rank_actual, rank_pred )

    โปรดทราบว่าข้างต้นเป็นพื้นฐานมาก ในสถานการณ์จริงของไคลเอ็นต์ คุณต้องการทดลองใช้อัลกอริธึมแบบจำลองจำนวนหนึ่งกับตัวอย่างข้อมูลการฝึก (ประมาณ 22% ของข้อมูล) ประเมิน (ใช้ส่วนที่เหลือ % ข้อมูล) และ เลือกรุ่นที่ดีที่สุด

    โฆษณา

    Back to top button