Blog

Python ile içerik uzunluğu hesaplama

Web üzerinde çalışan milyonlarca web sitesi var ve bu sitelerde üretilen içerikler, kullanıcıları merkezine alan ve onlara en önce ulaşmayı dileyen teamüllerle yazılır. Bunun için SEO optimizasyonu kullanılır ve kullanıcı taraflı düşünceden hareketle belirli anahtar kelimelere yer verilir. Botlar, bu anahtar kelimeleri başlık, meta description, sayfa içi yazı veya hedeflenen anahtar kelimelerde yakalamaya çalışır ve çeşitli filtrelerden geçirerek listeleme yapar. (SERP) Yazının uzunluğu da, SEO optimizasyonunda oldukça önemli bir konudur. Düşük HTML ögelerinin kullanıldığı, az kelimelerin yer aldığı bir belge, bazen dizine hiç eklenmemekle dahi sonuçlanabilir. Bunun önüne geçebilmek için sayfalarda ne kadar harf ve kelime kullanıldığını hesaplayabilen bir programlama dili var: Python!

Python kullanarak içerik uzunluğu hesaplamak isterseniz, requests ve BeautifulSoup gibi kütüphaneleri kullanarak web sayfalarından içerik çekebilir ve metin analizi yapabilirsiniz. Bu sayede içeriğinizin performansını değerlendirerek gerektiğinde ayarlamalar yapabilirsiniz.

SEO’da yüksek kaliteli içerik için minimum kelime sayısının ne olduğu sorusuna kesin bir yanıt yoktur. Farklı türdeki içerikler, kullanıcının arama niyetini karşılamak ve ilgili değerli bilgi sağlamak için farklı uzunluklara ihtiyaç duyabilir. Ancak bazı genel yönergeler şunlardır:

  • SEO için minimum kelime sayısı 300 kelimedir. Bu, arama motorlarında sıralanmak isteyen herhangi bir web sayfası için başlangıç noktasıdır¹².
  • Standart blog yazıları için ortalama kelime sayısı 1,000 kelimedir. Bu, bir konuyu derinlemesine ele almak ve birden fazla anahtar kelime için sıralanmak için yeterli bir uzunluktur.
  • Uzun içerikler için ortalama kelime sayısı 2,000 kelimedir. Bu, daha karmaşık veya rekabetçi konular için daha fazla yetki ve ayrıntı gerektiren uygun bir uzunluktur.
  • Haber makaleleri veya ürün sayfaları için ortalama kelime sayısı 300-500 kelimedir. Bu, temel bilgileri ve gerçekleri aşırı uzun olmadan sağlamak için yeterlidir.

Ancak bunlar kesin kurallar değildir ve SEO için en iyi kelime sayısı, konuya, rekabete ve kullanıcının arama niyetine bağlı olarak değişir.

Ayrıca mevcut içeriğinizin performansını kontrol etmek ve kelime sayınızı buna göre ayarlayıp ayarlamamanız gerektiğini görmek için Google Arama Konsolu’nu kullanabilirsiniz. Sonuç olarak, içeriğinizin kalitesi miktarından daha önemlidir, bu nedenle izleyicinizin ihtiyaçlarını ve beklentilerini karşılayan orijinal, etkileyici ve kapsamlı içerik oluşturmaya odaklanmalısınız.

Python ile içerik uzunluğu hesaplama

requests kütüphanesini Python projenize kurmak için aşağıdaki adımları takip edebilirsiniz:

  1. Pip’i Güncelleyin: Öncelikle, pip adlı paket yöneticinizin güncel olduğundan emin olun. Aşağıdaki komutu kullanarak pip’i güncelleyebilirsiniz: pip install --upgrade pip
  2. Requests Kütüphanesini Kurun: Daha sonra, requests kütüphanesini aşağıdaki komutla kurabilirsiniz: pip install requests

Bu komutu terminal veya komut istemcisinde çalıştırdığınızda, requests kütüphanesi otomatik olarak indirilip kurulacaktır. Artık projenizde import requests kullanarak bu kütüphaneyi kullanabilirsiniz.

Eğer Python 3 kullanıyorsanız, pip’i pip3 olarak da çağırabilirsiniz. Örneğin:


pip3 install requests

Bu adımları takip ettikten sonra, requests kütüphanesini kullanarak web istekleri yapabilirsiniz. Dosyanızı kaydedin ve daha sonra şu komutu yazın:


python buraya-kaydettiğiniz-dosya-ismini-girin.py

Örnek olarak:


python web_scraping_example.py

import requests
from bs4 import BeautifulSoup
import re

# URL'yi belirleyin
url = "https://advdyn.com/1212-senior-java-fullstack-developer/"

# Web sayfasını çekin
response = requests.get(url)
html_content = response.content

# BeautifulSoup ile HTML içeriğini parse et
soup = BeautifulSoup(html_content, 'html.parser')

# Belirli class'a sahip 
elementini bul entry_content_div = soup.find('div', class_='entry-content') #
içeriğini metin olarak al div_text = entry_content_div.get_text() # Metindeki karakter sayısını hesapla character_count = len(div_text) # Metindeki kelime sayısını hesapla word_count = len(re.findall(r'\w+', div_text)) # Sonuçları yazdır print("Metindeki toplam karakter sayısı:", character_count) print("Metindeki toplam kelime sayısı:", word_count)

Output

Hesaplamalar URL adresine göre yapılır, eğer URL adresini değiştirip kaydederseniz başka URL adresleri için de bu şekilde hesaplamalar yapabilirsiniz. Ayrıca, yaptığınız hesaplamaları Google Sheets’e aktarmak veya otomatik olarak yazdırmak için gspread kütüphanesini kullanabilirsiniz.

gspread kütüphanesi ile Google Sheets’e erişim sağlamak için oluşturduğunuz JSON dosyasını kullanmanız gerekecek. Bu dosyayı projenizin çalışma dizinine yerleştirin ve aşağıdaki gibi bir kod parçasını kullanarak erişim sağlayın:


import gspread
from oauth2client.service_account import ServiceAccountCredentials

# JSON dosyası ile erişim sağlama
scope = ["https://spreadsheets.google.com/feeds", "https://www.googleapis.com/auth/spreadsheets",
         "https://www.googleapis.com/auth/drive.file", "https://www.googleapis.com/auth/drive"]

credentials = ServiceAccountCredentials.from_json_keyfile_name("your-credentials.json", scope)
client = gspread.authorize(credentials)

# Hedef Google Sheets belgesini açın
spreadsheet = client.open("Your Google Sheet Name")
worksheet = spreadsheet.get_worksheet(0)  # İlk çalışma sayfasını seçin

worksheet nesnesini kullanarak verilerinizi Google Sheets’e yazabilirsiniz:


# Örneğin, karakter ve kelime sayılarını Google Sheets'e yazalım
character_count = 123
word_count = 25

# Verileri Google Sheets'e yazma
worksheet.update_cell(1, 1, "Metindeki toplam karakter sayısı:")
worksheet.update_cell(1, 2, str(character_count))
worksheet.update_cell(2, 1, "Metindeki toplam kelime sayısı:")
worksheet.update_cell(2, 2, str(word_count))