PostgreSQL içinde özel adların kaynaklanan engelleyin?

oy
2

Onun coşku içinde Stemm lexemelerin içine belirteçleri , PostgreSQL Tam Metin Arama motoru da uygun isimler azaltır. Örneğin:

essais=> select to_tsquery('english', 'bortzmeyer');
to_tsquery 
------------
'bortzmey'

essais=> select to_tsquery('english', 'balling');
to_tsquery 
------------
'ball'
(1 row)

İlki için En azından ben bunu ingilizce sözlükte değil eminim! kaynaklanan bu sahte önlemek için daha iyi bir yolu nedir?

Oluştur 09/12/2008 saat 21:43
kaynak kullanıcı
Diğer dillerde...                            


2 cevaplar

oy
4

Kaynaklanan algoritmaların noktasıdır değil onun uygun sapına her kelime azaltmak için; Amaç, ortak bir formu saplı için birbirine benzemez kelimeleri azaltmaktır. Genel olarak ilgilendiren 'yuvarlıyorsan' ve 'top' hem algoritma hala 'balling' ve 'top' gördüğü için doğrudur 'kjebnkkekaa' üretecektir bile: Amaç kullanıcıya sunulabilir bir kelime almak için değil genel olarak aynı şey.

Ayrıca hiçbir kaynaklanan algoritması daha fazla bilgi için, kesinlikle mükemmel olduğunu dikkat Porter Kaynaklanan algoritma bakmak

Cevap 09/12/2008 saat 22:12
kaynak kullanıcı

oy
2

Açıklandığı gibi Bu kartopuydu Stemmer nedeniyle olduğunu burada . Temelde Kartopu stemmer devre dışı bırakmak ve sadece Ispell veya diğer sözlükleri birini kullanmak isteyeceksiniz, ama bu da sözlüklerde olmayan kelimeler için kaynaklanan verimini azaltacaktır.

Cevap 09/12/2008 saat 22:21
kaynak kullanıcı

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more