Tạo nội dung tự động cho SEO: GPT-3 Khả năng và Cạm bẫy

Kể từ khi GPT-3 xuất hiện, các trình tạo nội dung đã nhân rộng các trường hợp sử dụng cho SEO. Có vẻ như một bản cập nhật hai tháng một lần để xem xét tiến bộ mới trong lĩnh vực mô hình ngôn ngữ đã được thực hiện.

Trước hết, vào cuối năm 2021, câu lạc bộ mô hình ngôn ngữ rất lớn đã phát triển đáng kể.

Mỗi quốc gia đã cố gắng giới thiệu các công nghệ của mình và làm cho chúng có thể tiếp cận được thông qua các tài liệu nghiên cứu và các cuộc trình diễn công khai hoặc riêng tư.

Dưới đây là các đối thủ chính trong cuộc đua:

  • US: OpenAI – Turing NLG.
  • Trung Quốc: Ngộ Đạo 2.0 – PanGu-Alpha.
  • Hàn Quốc: HyperCLOVA.
  • Israel: A121 (Kỷ Jura-1).
  • Châu Âu: Aleph Alpha.
  • Nguồn mở: EleutherAI.

Mỗi mô hình đều có điểm mạnh và điểm yếu.

Để kiểm tra chúng, nhiều biên tập viên phần mềm SEO hoặc đại lý SEO hiện đang thử nghiệm các mô hình này.

Làm thế nào để chọn một mô hình GPT-3?

Bạn có thể nghĩ rằng mô hình càng có nhiều tham số thì càng tốt (Lưu ý của người biên tập: một tham số tương ứng với một khái niệm được học bởi AI).

Quảng cáo

Tiếp tục đọc bên dưới

Nhưng bạn có thể đã sai.

Tiêu chí số một hoàn toàn không phải là số lượng thông số, bởi vì bạn có thể thu được kết quả tuyệt vời với các mẫu nhẹ hơn.

Đúng hơn, nó là dữ liệu mà mô hình được đào tạo.

Trên thực tế, để có hiệu quả, một mô hình phải có khả năng hiểu được một số lượng lớn các miền khác nhau.

Việc đầu tiên cần làm là tìm hiểu xem người mẫu đã được đào tạo như thế nào. Đối với GPT-3, sơ đồ sau giúp:

Sơ đồ GPT-3.Ảnh chụp màn hình từ GPT-3, tháng 10 năm 2021

Chúng ta có thể thấy rằng GPT-3 chủ yếu được đào tạo với dữ liệu từ:

Quảng cáo

Tiếp tục đọc bên dưới

  • Lưu trữ web từ năm 2016 đến năm 2019.
  • WebText, tương ứng với truy xuất dữ liệu trên web.
  • Wikipedia.
  • Sách bằng tiếng Anh (Books1)
  • Sách bằng các ngôn ngữ khác (Books2).

Bây giờ, nếu chúng ta nhìn vào cách các mô hình nguồn mở được đào tạo, chúng ta thấy rằng các nguồn khá khác nhau.

Nguồn dựa trên dự án The Pile.Ảnh chụp màn hình từ Gpt-3, tháng 10 năm 2021

Mọi thứ đều dựa trên dự án The Pile, một bộ dữ liệu gồm 825 GB văn bản tiếng Anh đa dạng, miễn phí và có thể truy cập được cho công chúng.

Với The Pile, chúng tôi tìm thấy dữ liệu rất đa dạng như sách, kho lưu trữ GitHub, trang web, tạp chí thảo luận, các bài báo về y học, vật lý, toán học, khoa học máy tính và triết học.

Nói chung, điều quan trọng là phải kiểm tra mô hình ngôn ngữ trong ngôn ngữ của bạn và đặc biệt là trên từ vựng cụ thể trên trang web của bạn.

Trước khi xem xét các trường hợp sử dụng SEO cụ thể, chúng ta hãy xem xét các cạm bẫy.

Cạm bẫy tạo nội dung GPT-3 cho SEO

Để tạo ra các văn bản định tính thu hút người dùng của bạn, điều quan trọng là phải biết những cạm bẫy cần tránh.

Trước hết, bất kỳ mô hình nào bạn chọn, bạn phải cung cấp cho nó các ví dụ chất lượng làm đầu vào để nó có thể bắt chước chúng và trên hết, tôn trọng một loại văn bản cụ thể.

Nếu bạn yêu cầu một mô hình ngôn ngữ tạo nội dung trên “thợ sửa ống nước ở New York”, thì mô hình đó sẽ đi xuống các đường dẫn khác nhau và thường không phù hợp:

  • Nó có nên tạo một thư mục được tạo sẵn không?
  • Nó có nên tạo nội dung về một thợ sửa ống nước ở New York không?
  • Nó có nên tạo ra một cuộc đối thoại giữa những người thợ ống nước ở Paris?
  • Có thể là một bài thơ về hệ thống ống nước ở New York?

Trong ngắn hạn, mô hình sẽ bị mất.

Thứ hai, các mô hình ngôn ngữ hoàn toàn không xử lý nội dung trùng lặp.

Quảng cáo

Tiếp tục đọc bên dưới

Do đó, bất kỳ văn bản nào bạn tạo ra, bạn sẽ phải sử dụng công cụ của bên thứ ba để kiểm tra xem mô hình có trùng lặp điều gì đó mà nó đã học được hay không – và đặc biệt hơn là văn bản đó chưa tồn tại và nó là duy nhất.

Có nhiều công cụ có sẵn để xác nhận nội dung của bạn có phải là duy nhất hay không. Nếu không, chỉ cần tạo lại nội dung.

Ngoài ra, các mẫu tạo nội dung hoàn toàn không tối ưu hóa văn bản cho tìm kiếm.

Một lần nữa, họ được đào tạo trên nhiều nguồn khác nhau, vì vậy bạn sẽ phải hướng dẫn họ tất cả các công cụ ngữ nghĩa hiện có trên thị trường.

Bạn cũng có thể yêu cầu họ nhấn mạnh các từ khóa và giải thích các khái niệm của bạn chi tiết hơn.

Cuối cùng, mô hình có thể phát minh ra dữ liệu. Thật vậy, các mô hình có một thiết lập sáng tạo.

Nếu mô hình được thiết lập để cho phép tính sáng tạo cao, đôi khi nó có thể tạo ra các đặc điểm cho một đối tượng, chẳng hạn, điều này có thể tạo ra sự mâu thuẫn trong văn bản của bạn.

Các trường hợp sử dụng tạo nội dung cho SEO

Trong tám tháng qua, tôi đã thử nghiệm nhiều trường hợp sử dụng tạo nội dung khác nhau.

Quảng cáo

Tiếp tục đọc bên dưới

Với các mẫu miễn phí như GPT-Neo và GPT-J, chúng tôi đã có kết quả rất tốt về các trường hợp sử dụng sau:

  • Trích xuất các khái niệm (trích xuất địa điểm, con người, v.v.).
  • Trích xuất câu hỏi từ một văn bản.
  • Câu trả lời cho các câu hỏi dựa trên một văn bản.
  • Tạo các văn bản ngắn chỉ bằng tiếng Anh để tạo tiêu đề hoặc mô tả meta.

Mặt khác, với mô hình trả phí như GPT-3 với giá cả có thể truy cập, chúng tôi không chỉ quản lý để tạo ra các văn bản dài và cụ thể mà còn tạo ra các bản tóm tắt văn bản phức tạp.

Tóm tắt văn bản tinh vi trong OpenAI.Ảnh chụp màn hình từ GPT-3, tháng 10 năm 2021

Hình ảnh không dễ đọc nhưng hiển thị các ví dụ đầu vào được in đậm, sau đó văn bản được tạo ra bởi mô hình được in nghiêng.

Quảng cáo

Tiếp tục đọc bên dưới

Ở đây, mục đích là tạo ra một văn bản khuyến khích để khiến mọi người muốn mua một sản phẩm.

GPT-3 hoàn toàn hiểu được âm điệu và độ dài cần thiết của văn bản và bao gồm các từ sẽ được sử dụng. Văn bản được tạo trong vòng chưa đầy 10 giây!

Đây là văn bản được tạo:

Cho đi những ước mơ thời thơ ấu của bạn. Bạn có còn nhớ trò chơi điện tử đầu tiên của mình không? Nhờ tiến bộ công nghệ, bạn có thể sống lại tất cả. Bạn có thể chơi với người chơi khác trên đường thông qua bảng điều khiển Nintendo DS, PlayStation hoặc Xbox!

Với Nintendo Switch, hãy thử các trò chơi thú vị như Mario Kart 8 Deluxe – vượt lên chống lại các đối thủ của bạn và tận hưởng cuộc phiêu lưu kỳ diệu với Mario, Zelda và các nhân vật khác. Thưởng thức một loạt các trò chơi AAA đáng kinh ngạc; cho dù bạn thích trò chơi chiến đấu hay trò chơi phiêu lưu hay trò chơi nhiều người chơi, PS4 cung cấp tư cách thành viên PS Plus để phù hợp với nhu cầu của bạn!

Xbox cũng có tính năng truy cập không giới hạn vào các ứng dụng giải trí như Netflix và Youtube với số tiền nhỏ. Cho dù bạn chọn PS4, xbox hay Nintendo Switch mới, bạn sẽ dễ dàng kết nối với gia đình hoặc bạn bè thông qua các ứng dụng như Skype để có khoảng thời gian tuyệt vời với bạn bè.

Quảng cáo

Tiếp tục đọc bên dưới

Đảm bảo không bỏ lỡ cơ hội này!

Tất nhiên, hiệu đính vẫn được yêu cầu để cải thiện văn bản, nhưng công nghệ này tiết kiệm rất nhiều thời gian và cho phép con người tập trung vào các vấn đề có giá trị gia tăng cao.

Hãy chuyển sang hai cuộc cách mạng trong việc tạo nội dung.

Hai cuộc cách mạng cho SEO

Trước đây, GPT-3 có thể không tạo được nội dung cụ thể vì nó không được đào tạo để làm như vậy, như chúng ta đã thấy trước đó.

Bây giờ, bạn có khả năng đào tạo lại mô hình.

Chỉ cần cung cấp cho nó từ 20 đến 100 ví dụ với hướng dẫn của bạn làm đầu vào và sự hoàn thành lý tưởng mà bạn muốn nó tạo ra dưới dạng đầu ra:

{"prompt":"CTA:nnsubject: smartphonenn words: smartphone, Samsung, mobile phones, Xiaomi, Samsung, Apple, Huawei, Sony, iPhone, intelligent mobile phones, Androidnn ","completion":"Looking for a new smartphone? You've shortlisted a Samsung Galaxy or a Huawei model, but you haven't made a decision yet? Choose a smartphone in our product range and enjoy the best of the new mobile phones at an unbeatable price! You're guaranteed to find a smartphone at the best price, so don't miss out! It's never easy to find the best option among a multitude of smartphones: Xiaomi, Samsung, Apple, Huawei, Sony, or even Honor. Smartphones - intelligent mobile phones - aren't just synonymous with Apple's iPhone, but include many models. Smartphones using the Android operating system are the most common."}

Thao tác này tốn nhiều thời gian nhưng sau đó bạn có một mẫu được tối ưu hóa phù hợp với trường hợp sử dụng của mình, đặc biệt nếu bạn cần sử dụng một từ vựng cụ thể cho một niche, ngành hoặc chủ đề cụ thể khi tối ưu hóa SEO của mình.

Điều này chỉ mất hai dòng mã Python. Tất nhiên, phần tốn thời gian nhất là tạo tệp ví dụ này.

Tệp ví dụ trên OpenAI.Ảnh chụp màn hình từ GPT-3, tháng 10 năm 2021

Cuối cùng, hãy chuyển sang chủ đề cuối cùng mà tôi đặc biệt hào hứng trong tháng này: tạo mã!

Quảng cáo

Tiếp tục đọc bên dưới

Trên thực tế, một công nghệ mới đã được phát hành để chúng tôi đưa ra hướng dẫn và công cụ OpenAI Codex mới có thể tạo mã Python để giải quyết các vấn đề của chúng tôi.

Hãy bắt đầu bằng cách chỉ ra rằng đây là những vấn đề đơn giản: nó không thể thay thế các nhà phát triển vì chúng ta cần cung cấp cho AI tất cả mã được thiết lập cũng như tất cả các ràng buộc kỹ thuật.

Mặt khác, theo quan điểm sư phạm và đặc biệt là trong cách tiếp cận không mã, thật tuyệt khi có thể yêu cầu nó kết nối với nguồn dữ liệu (Mysql, Excel, CSV, API, v.v.) và tạo xem ngay trong vài giây.

Tìm nạp tệp nhật ký NASA trong một ngày.Ảnh chụp màn hình từ GPT-3, tháng 10 năm 2021

Đây là một ví dụ nhỏ trong đó tôi tìm nạp tệp nhật ký NASA cho ngày 1 tháng 8 năm 1995 và yêu cầu biểu đồ thanh với tổng số URL được truy cập trong giờ.

Quảng cáo

Tiếp tục đọc bên dưới

Sau đó, với một trình soạn thảo văn bản đơn giản, bạn có thể xem kết quả bằng cách sao chép và dán mã.

Để đưa khái niệm không mã đi xa hơn nữa, tôi đang chuẩn bị một ứng dụng web mà mọi thứ sẽ được điều khiển bởi văn bản.

Giới hạn duy nhất trong việc sử dụng các mô hình ngôn ngữ trong SEO là trí tưởng tượng của bạn. Bạn chắc chắn có thể tạo toàn bộ bảng điều khiển SEO theo cách này bằng cách chia nhỏ từng chế độ xem bạn muốn, từng bước.

Các mô hình ngôn ngữ vẫn còn rất nhiều điều ngạc nhiên trong cửa hàng và có rất nhiều ứng dụng mới sắp được sử dụng để tiếp thị.

Nhiêu tai nguyên hơn:


Hình ảnh nổi bật: Vector Juice / Shutterstock

Leave a Comment