Cách hoạt động cơ bản của công cụ tìm kiếm - Học SEO căn bản

Cách hoạt động cơ bản của công cụ tìm kiếm - Học SEO căn bản

Công cụ tìm kiếm có hai chức năng chính: quét dữ liệu và xây dựng một bảng mục lục, và cung cấp cho người tìm kiếm một danh sách xếp hạng các website mà nó cho rằng là liên quan nhất. Hãy tưởng tượng mạng lưới mạng toàn cầu (the world wide web) như là mạng lưới các trạm dừng trên hệ thống tàu điện ngầm của một thành phố lớn.

Mỗi trạm dừng là một tài liệu đặc biệt (thông thường là một trang web, nhưng thỉnh thoảng là một file PDF, JPG, hay loại file khác). Công cụ tìm kiếm cần có cách để quét toàn thành phố và tìm ra tất cả các trạm dừng trên dọc đường, vì vậy nó sử dụng con đường tốt nhất có sẵn – các đường link.

Quét và tạo mục lục
Quét và tạo mục lục hàng tỷ tài liệu, trang web, file, tin tức, video, và file media trên mạng lưới thông tin toàn cầu.

Cung cấp câu trả lời
Cung cấp câu trả lời cho câu hỏi của người dùng, thường xuyên nhất thông qua các danh sách các trang liên quan mà nó nhận được và xếp hạng theo mức độ liên quan.

Cấu trúc đường dẫn của một trang web phục vụ cho việc nối tất cả các trang với nhau.

Các đường link cho phép các robot tự động của các công cụ tìm kiếm, được gọi là “crawlers” hay “spiders”, tiếp cận hàng tỉ các tài liệu liên kết với nhau trên web.

Khi các công cụ tìm kiếm tìm được những trang này, nó sẽ giải mã từ những trang này và lưu trữ những trang được chọn trong cơ sở dữ liệu, những tài liệu sẽ được tìm lại khi có các câu hỏi tìm kiếm. Để hoàn thành công việc lưu giữ hàng tỷ trang mà có thể được tiếp cận trong tích tắc, các công ty của công cụ tìm kiếm xây dựng những trên khắp thế giới.

Những cơ sở vât chất lưu trữ khổng lồ này lưu giữ hàng ngàn thiết bị xử lý khối lượng thông tin lớn rất nhanh. Khi một người thực hiện tìm kiếm tại bất kỳ công cụ tìm kiếm lớn nào, họ đều mong muốn có kết quả tức thì, thậm chí chậm 1 đến 2 giây cũng có thể khiến họ không hài lòng, vì vậy các công cụ tìm kiếm luôn cố gắng cung cấp câu trả lời càng nhanh càng tốt.

Các công cụ tìm kiếm có nhiệm vụ như những máy trả lời. Khi một người thực hiện một tìm kiếm trực tuyến, công cụ tìm kiếm lướt qua hệ thống hàng tỷ dữ liệu của nó và thực hiện hai việc: đầu tiên, nó trả lại chỉ những kết quả tương ứng hay có ích với câu hỏi tìm kiếm, thứ hai, nó xếp hạng những kết quả này dựa vào mức độ phổ biến của website cung cấp thông tin. SEO là quá trình ảnh hưởng lên cả mức độ liên quan và mức độ phổ biến.

Các công cụ tìm kiếm xác định mức độ liên quan và phổ biến bằng cách nào?

Đối với một công cụ tìm kiếm, mức độ liên quan có nghĩa là tìm ra được nhiều trang với những từ thích hợp. Trong những ngày đầu của web, các công cụ tìm kiếm không đi xa hơn bước đơn giản này, và các kết quả tìm kiếm có giá trị giới hạn. Qua các năm, các kỹ sư đã nghiên cứu ra những cách tốt hơn để có câu trả lời phù hợp với các câu hỏi tìm kiếm. Ngày nay, hàng trăm nhân tố ảnh hưởng đến mức độ liên quan, và chúng ta sẽ thảo luận những vấn đề quan trọng nhất của vấn đề trên trong hướng dẫn này.

Các công cụ tìm kiếm thường cho rằng những website, trang, hay tài liệu càng phổ biến, thì thông tin nó chứa đựng càng quan trọng hơn. Nhận định này đã được chứng minh là tương đối thành công trong việc làm hài lòng người dùng với kết quả tìm kiếm.

Mức độ phổ biến và liên quan không được xác định bằng cách thủ công. Thay vào đó, các công cụ dùng những công thức toán học (thuật toán) để sàng lúa mì bỏ trấu (mức độ liên quan), và sau đó xếp hạng lúa mì theo chất lượng (độ phổ biến). Những thuật toán này bao gồm hàng trăm biến. Trong lĩnh vực marketing tìm kiếm, chúng tôi xem nó như “những nhân tố xếp hạng”. Moz đã xây dựng tài liệu riêng cho chủ đề này: Nhân tố xếp hạng các công cụ tìm kiếm.

Vậy chúng ta làm thế nào để thành công?

Hay, "những nhà marketing tìm kiếm thành công bằng cách nào". Những thuật toán phức tạp của các công cụ tìm kiếm nhìn qua có thể khó hiểu . Thực chất, những công cụ tìm kiếm bản thân nó cung cấp một ít cái nhìn bên trong cho chúng ta làm cách nào đạt được kết quả tốt hơn hay tăng lượng truy cập. Những thứ nó cung cấp cho ta về tối ưu hóa và cách thực hiện tốt nhất được mô tả bên dưới:

THÔNG TIN VỀ SEO TỪ HƯỚNG DẪN CỦA CÁC WEBMASTER GOOGLE:

Google giới thiệu những cách sau để có được thứ hạng tốt trong hệ thống tìm kiếm của họ.

Xây dựng những trang web chủ yếu cho người dùng, không phải cho các công cụ tìm kiếm.
Đừng bỏ rơi người dùng của bạn hay trình bày nội dung khác nhau giữa các công cụ tìm kiếm và người dùng, thủ thuật này gọi là thủ thuật che giấu nội dung (cloaking)
Xây dựng một trang với một hệ thống rõ ràng và những đường link bằng chữ. Mỗi trang nên được tiếp cận ít nhất từ một đường link chữ cố định. Tạo một trang giàu thông tin có ích và viết những trang mô tả nội dung của bạn một cách chính xác và rõ ràng. Đảm bảo các yếu tố <tiêu đề="">và các thuộc tính ALT của bạn chinh xác và chứa thông tin mô tả.
Sử dụng các từ khóa để xây dựng các URL mô tả, thân thiện với người. dùng
Cung cấp một phiên bản của URL để tiếp cận các tài liệu, sử dụng 301 redirect hay thuộc tính rel=”canonical” để mô tả nội dung giống nhau.

THÔNG TIN VỀ SEO TỪ HƯỚNG DẪN CỦA CÁC WEBMASTER BING

Các kỹ sư Bing tại Microsoft giới thiệu một số cách sau để đạt thứ hạng tốt trong hệ thống tìm kiếm của họ:

Phải đảm bảo cấu trúc URL rõ ràng, giàu từ khóa.
Đảm bảo nội dung không bị lẫn với những file media lớn (Adobe, Flash Player, JavaScript, Ajax) và kiểm tra các file media đó không cản đường link của khỏi các crawler.
Tạo nội dung giàu từ khóa và phù hợp với các từ khóa mà người dùng tìm kiếm. Xây dựng nội dung mới thường xuyên.
Đừng để những từ ngữ mà bạn muốn truyền tải trong hình. Ví dụ, nếu bạn muốn tên công ty hay địa chỉ được đưa vào cơ sở dữ liệu của các công cụ tìm kiếm, đừng đặt chúng trong logo công ty.

Đừng Sợ Hãi, Những Đồng Nghiệp Marketing Tìm Kiếm!

Bên cạnh lời khuyên miễn phí này, hơn 15 năm qua công cụ tìm kiếm web đã tồn tại, những nhà marketing tìm kiếm đã tìm ra cách lấy thông tin về cách các công cụ tìm kiếm xếp hạng các trang. SEO và những nhà marketing sử dụng các dữ liệu đó để giúp website của họ và khách hàng đạt được vị trí tốt hơn.

Bất ngờ thay, những công cụ tìm kiếm có thể hỗ trợ những nỗ lực này, mặc dù khả năng hiển thị công cộng thường thấp. Hội nghị về marketing tìm kiếm, như Search Marketing Expo, Pubcon, Search Engine Strategies, Distilled, và MozCon của Moz thu hút các kỹ sư và nhà đại diện từ tất cả các hãng công cụ tìm kiếm lớn. Các đại diện tìm kiếm cũng hỗ trợ các webmaster bằng cách thỉnh thoảng tham gia trực tuyến vào các blog, forum và blog.

Có lẽ sẽ không có công cụ có sẵn nào tốt hơn cho các webmaster nghiên cứu hoạt động của các công cụ tìm kiếm bằng cách thực hiện các thử nghiệm, kiểm tra giả thuyết và hình thành ý kiến. Nó thông qua một quá trình lặp đi lặp lại – đôi khi khó nhọc – để có được lượng kiến thức đáng kể về cách hoạt động của các công cụ tìm kiếm. Một vài thí nghiệm chúng tôi đã thử như thế này:

- Đăng ký một website mới với những từ khóa vô nghĩa (ví dụ như ishkabibbell.com).
- Tạo nhiều trang trên website của bạn, tất cả đều hướng đến một thuật ngữ không có nghĩa quen thuộc (ví dụ như yoogewgally).
- Tạo ra những trang càng giống nhau càng tốt, sau đó mỗi lần một biến, thử nghiệm các vị trí đặt chữ khác nhau, format khác nhau, sử dụng các từ khóa, cấu trúc link, v.v.
- Liên kết các link từ các tên miền có các trang được lập chỉ mục, và quét tốt.
- Lưu lại thứ hạng các trang web trên các công cụ tìm kiếm.
- Bây giờ thực hiện một số thay đổi nhỏ với các trang và đánh giá tác động của nó lên các kết quả tìm kiếm để xác định các nhân tố nào có thể đẩy kết quả tìm kiếm lên hoặc xuống so với các kết quả khác.
- Lưu giữ lại bất kỳ kết quả nào hiệu quả, và kiểm tra lại trên các tên miền khác hay với các thuật ngữ khác. Nếu một vài các bài kiểm tra đều liên tục trả về cùng một kết quả, bạn đã tìm ra được mô hình hoạt động của các công cụ tìm kiếm.

Một bài kiểm tra ví dụ chúng tôi đã thực hiện

Trong bài kiểm tra này, chúng tôi bắt đầu với giả thuyết một link trước đây (quan trọng hơn) ở trang này nặng hơn các link ở trang dưới. Chúng tôi đã kiểm tra điều này bằng cách tạo ra một tên miền vô nghĩa với một trang chủ có đường link tới ba trang khác có cùng những từ ngữ vô nghĩa xuất hiện đúng một lần trên trang web. Sau khi công cụ tìm kiếm quét các trang, chúng tôi tìm ra được rằng các trang có link sớm nhất được xếp hạng nhất.

Quá trình này có ích, nhưng không phải chỉ là duy nhất trong việc huấn luyện các nhà marketing tìm kiếm.

Bên cạnh những bài kiểm tra kiểu này, các nhà marketing tìm kiếm có thể thu thập được thông tin quý giá về các công cụ tìm kiếm hoạt động thông qua một đăng ký sáng chế được tạo ra bởi các công cụ lớn của Văn Phòng Sáng Chế Hoa Kỳ. Một trong những bài kiểm tra nổi nhất trong số này có lẽ là hệ thống đã làm nên tên tuổi của Google tại ký túc xá trường Đại học Stanford những năm cuối thập niên 1990, PageRank, được lưu lại dưới tên gọi là Patent #6285999: “Phương pháp cho xếp hạng nút trong một cơ sở dữ liệu liên quan”. Một bản gốc về chủ đề này – Cấu tạo của một công cụ tìm kiếm siêu văn bản – cũng đã trở thành chủ đề của một nghiên cứu lớn. Nhưng đừng lo lắng, bạn không phải quay lại sử dụng tích phân để luyện tập SEO!

Thông qua các phương pháp như phân tích patent, thử nghiệm, hay kiểm tra trực tuyến, các nhà marketing tìm kiếm như một cộng đồng đã hiểu ra được những nguyên tắc hoạt động cơ bản của các công cụ tìm kiếm và những cấu thành then chốt để tạo ra các trang web và trang có thứ hạng cao và lượng truy cập đáng kể.