• Сонгодог дотор муухайрах. Текстийн дотор муухайрах (спамина): энэ нь юу вэ, яагаад үүнийг тоолох ёстой вэ, үүнийг хэрхэн хэвийн болгох вэ? Дотор муухайрах, спам илгээхийг шалгах үйлчилгээ

    06.12.2020

    Дотор муухайрах нь тухайн үг текстэд хэр олон удаа тохиолдож байгааг харуулдаг. Өөр өөр тооцооллын аргуудтай хоёр параметр байдаг:

      Сонгодог дотор муухайрах.Энэ нь текстийн эзлэхүүнээс хамаардаггүй. Энэ нь хамгийн олон давтагдсан үгийн нийт дурдсан тооны язгуураар тооцогдоно. Хэрэв "машин" гэдэг үг 22 удаа тохиолдвол сонгодог давтамж нь 4.69 байна.

      Академик дотор муухайрах.Текстийн хэмжээнээс хамаарна. Энэ нь нийт давтагдсан үгсийг нийтлэл дэх нийт үгийн тоонд харьцуулсан харьцаагаар тооцоологддог. Олон нийтийн орчинд эрдэм шинжилгээний дотор муухайрах гэж үздэг найдвартай томьёо байдаггүй.

    Дотор муухайрах шинжилгээний үйлчилгээ

    Advego.ru/text/seo үйлчилгээ дээр бичсэний дараа бүх текстийг тодорхой үзүүлэлтүүдийг шалгаж үзэх шаардлагатай бөгөөд ингэснээр Баден-Бадены алгоритм ямар ч гомдолгүй болно. Тухайлбал: текстийн академик дотор муухайрах - 7.5% -иас ихгүй, текстийг үгээр нь дотор муухайрах - 2.5% -иас ихгүй байна.

    Текстийн дотор муухайрах нь ямар байх ёстой вэ

    660,000 гаруй сайтыг сурталчилдаг WebEffector үйлчилгээ нь дотор муухайрах 8% -иас илүүг түгшүүртэй гэж нэрлэдэг.

    pr-cy.ru сайтын шинжилгээний үйлчилгээ нь академик дотор муухайрах 8 хүртэлх хуудсыг баталдаг. Хэрэв оноо өндөр байвал үйлчилгээ нь текстийг хэт спамдсан гэж үздэг. Дотор муухайрах нь 4% -иас доош байвал хуудсыг сурталчлах нь хэцүү байх болно гэж таамаглаж байна. Pr-cy.ru-ийн дагуу оновчтой параметр нь 4-6% байна.

    Эдгээр зөвлөмжийг 2007 оноос хойш SEO хийж байгаа Олег Кириллов дагаж мөрддөг. Олег pingoblog.ru блогтоо дараахь зүйлийг зөвлөж байна.

    8-9% хүртэл түвшинд (дотор муухайрах) наалдана. Энэ бол текстийн чанарын маш шууд бус боловч нэлээд хүчтэй үзүүлэлт юм. Тэд семантик утгыг шалгахгүй, гэхдээ тэд техникийн үнэлгээ өгөх болно.

    Гэсэн хэдий ч өндөр хувьтай хуудсууд асуудалд тэргүүлэгч болж чадна.

    Хүсэлтээр " хуванцар цонх"Эхний ээлжинд "Цонхны үйлдвэр" компанийн вэбсайт:

    pr-cy.ru сайтаар дамжуулан хуудсыг шалгахад түүний дотор муухайрах нь 9.64% байсан. Хоёрдугаар байр нь 13.15% дотор муухайрахтай хуудас руу ордог. Санал болгож буй стандартад нийцсэн дотор муухайрах хуудас - 6.7% - зөвхөн гуравдугаар байранд байна.

    Бид SEO мэргэжилтнүүдээс нөхцөл байдлын талаар тайлбар өгөхийг хүссэн. FreshLead SEO студийн эзэн Владислав Дикан дараахь зүйлийг санал болгож байна.

    Өндөр өрсөлдөөнтэй асуулгад дотор муухайрахыг тооцоол. Энэ нь ямар байх ёстой вэ гэдэг нь тодорхой хүсэлтийн ТОП-3-т багтсан өрсөлдөгчдөөс хамаарна. Тэд ямар үзүүлэлттэй байгааг харж, ижил үр дүнд хүрэх хэрэгтэй. Би хувьдаа текстийг өөрөө төдийгүй гарчиг, мета шошго, тэр ч байтугай хардаг .

    Үүнийг бас хэлдэг

    Эцэст нь, текст дэх "ус" -ын хэмжээг тодорхойлдог өөр нэг дунд зэргийн ашиггүй параметр. Үүнийг маш энгийнээр тооцдог: бид ач холбогдолгүй үгсийн тоог авч, баримт бичигт байгаа үгсийн нийт тоонд хуваана. Ач холбогдолгүй зүйл бол угтвар үг, бөөмс, төлөөний үг, товчлол болон бусад үгс бөгөөд тэдгээр нь өөрөө семантик ачаалал өгдөггүй.

    Энэ параметрт эрүүл үр тариа байгаа нь гарцаагүй. Хэт их "ус" - одоо текстийн утга олон тоогоор алдагдаж байна "Мэдэгдэж байгаагаар", "төсөөлөхөд хялбар", орчин үеийн ертөнц» болон "Залуу динамик компани". Үүний эсрэгээр та "хуурай" текстийг шууд үзэх хэрэгтэй болно, бүх оюутнууд энэ талаар мэддэг.

    Гэхдээ усны агууламж нь хайлтын системийг оновчтой болгохтой шууд бус холбоотой байдаг. Түүнчлэн, шинж чанар нь текстийн сэдэв, түүний бүтэц, ашигласан нэр томъёог харгалздаггүй. Метафор болон үгийн тоглоомыг дурдахгүй өнгөрч болохгүй. "Евгений Онегин"-ийн усны агууламжийн шинжилгээ нь 70 гаруй хувийг ("хамгийн оновчтой", "шинжээчдийн" санал болгосон 60%), Бродскийн шүлгүүдэд 80% -иас бага "ус" агуулдаг. Энэ бол Бродскийн "олон хэмжээст" утгатай зүйл юм!

    Яруу найраг бол нэг зүйл, арилжааны зохиол бол өөр зүйл гэж хэлэх үү? Зөв. Гэхдээ хүмүүс хоёуланг нь уншдаг. Үүний 70 орчим хувийг ус эзэлдэг.

    Ашиггүй байдлын нотолгоо

    Эсвэл, илүү нарийвчлалтай, дээрх параметрүүдийн хамааралгүй байдал. Дараа нь бид хэлний шинж чанарууд руу шилждэг.

    Нөлөөллийн нягтрал (давтамж) ямар байгааг ойлгохын тулд түлхүүр үгс, сонгодог болон эрдэм шинжилгээний дотор муухайрах, хайлт дахь сайтын зэрэглэл дэх текстийн устай байдал, би 5 дурын асуулгад Yandex хайлтын үр дүнд эхний арван сайтад дүн шинжилгээ хийсэн: "Машин хуваалцах", "вэб сайтын сурталчилгаа", "чип нислэг", "Нягтлан бодох бүртгэлийн үйлчилгээ Москва"болон англи хэл дээр хуулбар бичих. Сайт бүрийн хувьд дөрвөн параметрийн сайтын зэрэглэлтэй хамаарлыг тооцоолж, олж авсан өгөгдлийн регрессийн шинжилгээг хийж, боломжит хамаарлыг тодорхойлсон.

    Судалгааны дэлгэрэнгүйг спойлер дор доор харуулав. Математик сонирхдоггүй хүмүүсийн хувьд шууд дүгнэлт рүүгээ орцгооё.

    [+] Текстийн параметрүүд болон хайлтын байрлал хоорондын хамаарлын тооцоо

    Хайлтын хэллэг бүрийн хувьд би Yandex-д Москва мужид хайлт хийсэн. Хайлтын эхний 10 үр дүнгийн хувьд дараах үйлдлүүдийг хийсэн.

    1. Сайт нээх.
    2. Ctrl+A, Ctrl+C товчийг дарна уу.
    3. Advego семантик текст шинжилгээний үйлчилгээний текст талбарт буферийн агуулгыг буулгана уу.
    4. Хүлээн авсан параметрүүдийг бичнэ үү.

    Үр дүн нь дүн шинжилгээ хийсэн дөрвөн параметр бүрийн 10 утгын 5 бүлэг байв. Хайлтын байршилтай параметрүүдийн хамаарлын утгыг эхлээд тус тусын түлхүүр үгсийн хувьд тооцоолсон болно, жишээлбэл. бүлгүүдээр. Дараа нь нийт түүврийн хувьд корреляцийн ерөнхий коэффициентийг тооцоолсон.

    Бүх өгөгдлийг хүснэгтэд нэгтгэн харуулав. Бүрэн хэмжээгээр нээхийн тулд товшино уу.

    Пирсоны хэлснээр корреляци нь зөвхөн шугаман хамаарлыг эсвэл үүнтэй ойролцоо "барьдаг". Тиймээс, ямар ч тохиолдолд бид өгөгдлийн регрессийн шинжилгээг хийх болно.

    Ерөнхийдөө бүх зүйл энгийн нүдээр харагддаг. Тиймээ, параметр бүрийн утгын хувьд зарим хязгаарлалт байдаг боловч хуваарилалтад тодорхой систем байдаггүй. Гэсэн хэдий ч хил хязгаар байгаа нь юу ч гэсэн үг биш юм. Хэрэв бид утга учиртай текстийг биш, харин үгийн багцыг задлан шинжилж үзвэл ямар ч хил хязгаар гарахгүй, учир нь Үгсийн давтамжийн дээд ба доод утгыг эсвэл усны агууламжийг ямар нэг эрэмбийн алгоритмаар бус хэлний синтакс, морфологи, текстийн бүтцээр тодорхойлдог.

    Ойролцоогоор хамгийн их найдвартайгаар бүтээгдсэн регрессийн тэгшитгэлүүд нь энд гадны элементүүд шиг харагдаж байна: эмх замбараагүй байдал бол эмх замбараагүй байдал юм. Найдвартай байдал нь нэгдмэл байдлаас хамаагүй бага юм.

    Мэдээжийн хэрэг, шинжилгээ нь бүрэн гүйцэд гэж хэлэхгүй. Гомдоллох зүйл байна: жижиг түүвэр, функцийн утгын хангалтгүй гүн (сайтын байрлал), холимог асуулгын сэдвүүд. Хайлтын 20-р хуудасны хаа нэгтээ зураг миний хүлээн авсан зургаас эрс өөр байх магадлалтай.

    Хэрэв хэн нэгэн шалгаад үр дүнгээ хуваалцвал би талархах болно.

    Үр дүн нь дараах байдалтай байна: авч үзсэн параметрүүдийн аль нь ч хайлт дахь сайтын байрлалтай мэдэгдэхүйц хамаарал байгааг харуулаагүй. Энгийнээр хэлэхэд дотор муухайрах, услах, давтамж нь ч гэсэн байрлалд мэдэгдэхүйц нөлөө үзүүлэхгүй. Наад зах нь дээрх асуултуудын эхний арван Yandex үр дүнгийн сайтуудын хувьд.

    Бас хэд хэдэн ажиглалт.

    Өдөр бүр хуулбар зохиогчид увайгүй үйлчлүүлэгчдийн санаа зовнилын бүх ачааг мөрөндөө үүрдэг хэт их ачаалалтай луус шиг харагдана. Захиалсан нийтлэлийн хэв маяг, тэмдэгтүүдийн тоо эсвэл текстийн сонгосон бүтэц дэх үйлчлүүлэгчийн хүсэл нь нэлээд үндэслэлтэй боловч энэ нь тэдний санаанд ордог зүйл биш юм. Одоо ажлынхаа төлөө бага хэмжээний төлбөр санал болгодог хоёр дахь үйлчлүүлэгч бүр яагаад ч юм хуулбар зохиогч нь маркетингийн хэлтэс, борлуулалтын ажилтнууд, ялангуяа SEO мэргэжилтнүүдийг солих ёстой гэж боддог. Тиймээс тэдгээрт Даалгаврууд нь: , сонгодог дотор муухайрах, голын дээд үгсийн нягтрал, гарчиг гэх мэт үзүүлэлтүүд улам бүр нэмэгдэж байна.

    Туршлагатай хуулбар зохиогчийн ийм хүсэл нь эргэлзээгүй, гэхдээ энэ чиг хандлага нь зах зээлийн ирээдүйн стандартын талаар бодоход хүргэдэг. Ийм урьдчилсан нөхцөлтэй бол SEO мастерууд сайтыг оновчтой болгохын тулд бүх ажлыг хийх үйлчлүүлэгч болон хуулбар зохиогчийн хооронд энгийн зуучлагч болж хувирах цаг тийм ч их биш юм. Гэвч аливаа зах зээлийн мөн чанар өөрчлөгддөг бөгөөд хурдан дасан зохицож чаддаггүй хүмүүс тэр даруйдаа "тарган" худалдан авагчдын хараанаас салдаг. Тиймээс, уур хилэнгийн шуургыг үл харгалзан хамраа эргүүлэхээ больж, тэд биднээс юу хүсч байгааг олж мэдье, даалгаварт хүссэн зүйлээ зааж өгье. академик дотор муухайрах хувь.

    Эрдмийн баримт бичиг Дотор муухайрах

    Төрөл бүрийн эх сурвалжууд, түүний дотор алдартай Advego дээр бид академик дотор муухайрах нь текст дэх нийт үгсийн тоонд хамгийн их давтагдсан түлхүүрүүдийн хувь юм гэж хэлсэн. Бүгд ижил эх сурвалжаас, текст бичихдээ бид хайлтын системд нийтлэлийг өндөр чанартай оновчтой болгохын тулд 6-9% дотор муухайрах хүрээг санал болгож байна. Гэхдээ энэ нь юу гэсэн үг вэ, яагаад хэрэгтэй вэ? Ерөнхийдөө энэ нь түлхүүр үг бүхий текстийг спамдаж буйн үзүүлэлт гэдгийг бид ойлгож байгаа бөгөөд хэт спам нь хайлтын роботуудыг нийтлэл эсвэл сайтыг бүхэлд нь шүүлтүүрт оруулахыг албаддаг гэдгийг бид мэднэ.

    Шүүлтүүрийн үр дагаврыг хэн нэгэнд тайлбарлах шаардлагагүй гэж бодож байна уу? Гэтэл яагаад 6-9 хувь, ямар томьёогоор энэ хувийг тооцож байгаа нь огт ойлгомжгүй байна. Би хувьдаа энэ үзүүлэлтийн найдвартай байдалд ноцтой эргэлзэж байна. Юуны өмнө, ямар ч хэрэглэгч үүнийг хэрхэн тооцдогийг 100% мэддэггүй. Би бүр илүү ихийг хэлэх болно - Адвегогийн захиргаа эрдэм шинжилгээний дотор муухайрахыг тооцоолоход ямар томъёог ашигладаг болохыг мэдэхгүй.

    Дээрх хавсаргасан дэлгэцийн агшин дээрх "... тайлбар хийгээгүй" гэсэн хэллэг нь энэ тохиолдолд компанийн нууцыг илэрхийлдэггүй, харин зүгээр л мунхаглал юм. Эрдэм шинжилгээний дотор муухайрахад нэмэлт анхаарал хандуулж байгаагийн бас нэг баталгаа бол янз бүрийн сэдвээр дугаарын дээд талд байгаа олон арван хуудас юм. Тэдгээрийн хувьд энэ үзүүлэлт ихэвчлэн 10.11, тэр ч байтугай 13% -иар буурдаг. Би яарах хэрэггүй, харин амархан шалгаж болох өгөгдөл дээр ажилладаг.

    Эрдмийн дотор муухайрах нөхцөл байдал нь хайлтын системээр эрэмбэлсэн онцлогтой холбоотой юм. Google цэг, таслал, зураг, товчлуур болгонд дүн шинжилгээ хийдэг гэдгийг бид мэднэ. Тиймээс хуудасны эцсийн статистик тоонууд нь түүн дээр байрлуулсан баримт бичгийнхээс ялгаатай байх болно. Дээр дурдсан бүх зүйл бидэнд хоёр зүйлийг хэлж байна: нэгдүгээрт, та 6-9% -ийн хүрээг тийм ч хатуу барьж болохгүй, хоёрдугаарт, энэ нь мэдээлэл огт хэрэггүй гэсэн үг биш юм. Хэрэв та заасан утгыг дагаж мөрдвөл шүүлтүүрт орох эрсдэл мэдэгдэхүйц буурах боловч текстээс болж асуудлын дээд хэсэгт ороход илүү хэцүү байх болно.

    Сонгодог баримт бичгийн дотор муухайрах

    Сонгодог дотор муухайрах үед бүх зүйл илүү хялбар байдаг, учир нь энэ нь хамгийн их давтагдсан түлхүүрийн коэффициент юм. Үүнээс гадна та энд ямар нэг зүйлийг өөрчлөх шаардлагагүй. Тооны машинд хамгийн олон давтамжтай товчлуурын давталтын тоог оруулаад, жишээ нь 43, "√" (квадрат язгуур) товчийг дараад бидний коэффициентийг аваарай. Жишээлбэл, энэ нь 6.56 гарч ирдэг. Үүний дагуу текст тутамд 36 үгтэй бол коэффициент нь 6, 7 үгэнд - 2.64 гэх мэт. Шинэхэн хуулбар зохиогчдын хувьд гол зүйл бол сонгодог дотор муухайралтыг шинжлэхэд анхааралдаа аваагүй түлхүүрийг зогсоох үгстэй андуурч болохгүй.

    Хайлтын системүүдийн хүндэтгэдэг хуудсуудыг харгалзан үзэхэд олон SEO мэргэжилтнүүд баримт бичигт 7-ийн хүчин зүйлийг оновчтой гэж үздэг. Долоооос доош үзүүлэлт нь сайтад хор хөнөөл учруулахгүй боловч бусад зэрэглэлийн баримтаас хамааран нөөцийг сурталчлах үр нөлөөг бууруулж болзошгүй юм. Хэрэв та санал болгож буй утгыг хэтрүүлэхээр шийдсэн бол хайлтын системд, өөрөөр хэлбэл шүүлтүүрт орох эрсдэлтэй.

    Текстийн дотор муухайралтыг шалгах програмууд

    Баримт бичгийг оновчтой болгох, эсвэл зүгээр л TOR-ийн хүсэлд нийцүүлэх ажлыг хурдан шийдвэрлэхийн тулд та янз бүрийн програмын тусламжид хандах хэрэгтэй. Би тэдний хамгийн алдартай, алдартайг нь зааж өгөх болно. Маргаантай нөхцөл байдлаас зайлсхийхийн тулд юу ашиглах, өөрөө шийдэх эсвэл үйлчлүүлэгчээс юу хэрэглэж байгааг нь асуугаарай.

    Тодорхой интерфейс, хязгааргүй тооны шалгалт, баримт бичигт шаардлагатай шалгуур үзүүлэлтүүдийн хамгийн бага жагсаалт.

    Баримт бичгийг академик коэффициентийг шалгахдаа өвөрмөц байдал, зөв ​​бичгийн дүрэм, тэмдэгтийн тоо гэх мэтийг нэмж шалгана. Бүртгэлгүй чекийн тоо өдөрт хязгаарлагдмал. Дотор муухайрах нь энд "спамина" хэлбэрээр илэрдэг бөгөөд энэ нь зарчмын хувьд Advego дахь эрдэм шинжилгээнийхтэй төстэй боловч нэгэн зэрэг өөрийн алгоритмыг ашигладаг. Сайтыг буулгахад зориулсан шалгалтын дарааллаас шалтгаалж шалгахад Advego-оос илүү удаан хугацаа шаардагдана.

    Текстийг хурдан засварлах, засварлах тохиромжтой үйлчилгээ. Сонгодог дотор муухайралтыг харуулж, мөн усны агууламж, баримт бичгийн газрын зургийг (үгсийн нягтрал) нүдээр харуулдаг. Шалгалтад хязгаарлалтгүйгээр маш хурдан ажилладаг.

    Текстийг нийтлэхээс өмнө энэ үйлчилгээнд үүнийг шалгах боломжгүй боловч өөрийн URL хаягтай төслийг хурдан шалгадаг. Тэмдэгтийн тоо, дотор муухайрах, үгсийн нягтрал зэргээс гадна чек нь танд дотоод болон гадаад холбоосууд, түүнчлэн гарчиг нь тексттэй холбоотой байх болно.

    Цаашид ажиллахын тулд татан авах шаардлагатай хэд хэдэн програмууд байдаг, гэхдээ би баримт бичгийн дотор муухайрахыг тодорхойлохын тулд компьютер болон өөрөө ачаалах ямар ч шалтгаан олж харахгүй байна. Өгөгдсөн жишээнүүд энэ асуудлыг шийдвэрлэхэд хангалттай юм.

    Текст дотор муухайрахыг багасгах эсвэл нэмэгдүүлэхийн тулд юу хийж болох вэ?

    Хэрэв та академик болон сонгодог дотор муухайрах гэж юу болохыг ойлгосон бол тэдгээрийн үнэ цэнийг тохируулах нь танд хэцүү биш байх болно. Гэхдээ би бататгахын тулд хэд хэдэн жишээ хэлье.

    Сонгодог дотор муухайрахыг багасгах жишээ

    Академик дотор муухайрахыг багасгах жишээ

    Дараа нь:


    Голоос нь нэг үг ч багасах тусам дотор муухайрах нь хоёулаа өөрчлөгддөгийг онцгой анхааралтай уншигчид анзаарсан байх. Та яагаад эрдэм шинжилгээний дотор муухайрахдаа нэг үгийн оронд хэд хэдэн үгийг сольдог вэ гэж гайхсан байх. Үнэн хэрэгтээ нэг үгийг өөрчилж болно, гэхдээ хэрэв AT хэт өндөр байвал түүнийг маш ихээр бууруулах шаардлагатай бөгөөд энэ нь хайлтын роботуудад ач холбогдолтой болно. Үүнээс зайлсхийхийн тулд хэд хэдэн үгийн тоог нэгэн зэрэг багасгах нь илүү хялбар байдаг.

    Хэрэв танд энэ сэдвээр асуулт байвал сэтгэгдэл дээр эсвэл миний зааж өгсөн харилцагчдын аль нэгэнд бичээрэй. Би баяртайгаар хариулах болно.

    Бид сулласан шинэ ном"Агуулгын маркетинг нийгмийн сүлжээнд: Хэрхэн захиалагчдын толгойд орж, брэнддээ дурлах вэ.

    Текст дотор муухайрах гэдэг нь текстэд тодорхой үг хэрэглэх давтамж юм.

    Дотор муухайрах нь зарим үг, синонимуудын давталтыг харгалзан үздэг. Зөвхөн гол хэллэгүүд төдийгүй ижил утгатай үгсийг анхаарч үздэг.

    Дээр Шинэ ончи маш их мандарин идсэн. Тэгээд та өвдөж эхэлдэг. Таньд мандарин, жүрж орохоо больсон. Бүх цитрус жимс нь гаг рефлекстэй байдаг.

    Маш олон мандарин байсан. Хэрэв бид бүх ижил утгатай үгийг Мандарин гэж үзвэл текстэд дотор муухайрах болно. Хэт олон давтагдсан хэллэг.

    SEO-д үзүүлэх нөлөө

    Эрэмбэлэх алгоритмууд нь зөвхөн түлхүүр үгсийн нягтрал төдийгүй хэллэгүүдийн нийт давталтын тоог харгалзан үзэхэд "дотор муухайрах" гэсэн нэр томъёо гарч ирэв.

    Үүний дагуу энэ үзүүлэлт бага байх тусам хайлтын үр дүнд хуудас өндөр байр эзэлнэ. Гэсэн хэдий ч энэ нь текст эсвэл усны агууламж гэх мэт тийм чухал үзүүлэлт биш юм.

    Дотор муухайрах төрлүүд

    Мэргэжилтнүүд дотор муухайрах материалын зөвхөн хоёр үндсэн төрлийг тодорхойлдог тул бид тэдгээрийн талаар ярих болно.

    сонгодог

    Энэ нь сонгодог текст дотор муухайрах, Advego нөөцийн үйлчилгээ, тухайлбал семантик анализатор https://advego.com/text/seo/ гэдгийг төгс харуулж, харуулж байна. Энэ нь үг, хэллэгийн давталтын тооны квадрат язгууртай тэнцүү байна. Жишээлбэл, хэрэв ямар нэгэн үг нэг хуудсан дээр 25 удаа тохиолдвол дотор муухайрах нь яг 5 байх болно. Хэрэв хоосон зайгүй текстийг бүхэлд нь дор хаяж 8-10 мянган тэмдэгттэй бол энэ утга хэвийн хэмжээнд байна.

    Хайлтын роботуудаар зохиомлоор нэмсэн түлхүүр үг, хэллэгүүд нь түүний хувьд үхэлд хүргэх тул жижиг хэмжээтэй текстийг илүү анхааралтай шалгах хэрэгтэй.

    Хайлтын системд спам гэж үзэхгүйн тулд текстийн дотор муухайрах нь юу байх ёстой вэ гэдэг чухал асуулт юм. Хэвийн хүрээнд "сонгодог" нь 1-ээс 5 хүртэлх үзүүлэлт гэж тооцогддог. Ийм дотор муухайрах хамгийн их зөвшөөрөгдөх утга нь долоогоор төгсдөг. Бусад бүх тохиолдолд роботууд таны текстийг машинд хийсэн, аймшигтай хэт спамтай гэж үзэх бөгөөд энэ нь ач холбогдлын хувьд зэрэглэл дэх хуудсыг нэн даруй бууруулж болзошгүй юм.

    Академик

    Ялангуяа энэ үзүүлэлтийн хувьд нийтлэл эсвэл бусад текст дэх бусад үгсийн хувиар текстийн академик дотор муухайрахыг тодорхойлдог томъёог боловсруулсан болно. Энэ нь түлхүүр асуултуудын түлхүүр үг биш хэллэг, үгсийн зөв тооцоолсон харьцааг (хувиар) илэрхийлнэ. Бүрэн ойлголттой байхын тулд хамгийн энгийн математик пропорцийг бүрдүүлдэг энэ үзүүлэлтийг тооцоолох тодорхой жишээг өгье.

    • 18 тохиолдол - X%.
    • 780 үг - 100% текст.
    • X \u003d 100 * 18 / 780 \u003d 2.307%
    • X = 2.305=7%

    Тиймээс, тусгай үйлчилгээ ашиглан текстийг дотор муухайрах эсэхийг шалгах нь хэвийн хэмжээнд байгаа энэ үзүүлэлтийг өгөх ёстой. Үнэн хэрэгтээ энэ нь академик дотор муухайрах нь тохиолдлын давтамжийг шууд илэрхийлдэг гэж үзэж болно.

    Үндсэн алдаа

    Текст бичихдээ гол асуулт, үг, хэллэгийг хэт их ашиглахыг анхаарч үздэг. Үүнээс болж туйлын хүсээгүй, өндөр бичиг баримттай дотор муухайралт үүсдэг бөгөөд энэ нь өмнө нь мэдэгдэхүйц үр дүнд хүрч байсан боловч шинэ үйлчилгээ хөгжихийн хэрээр үр дүнгүй болсон.

    Текстийн дотор муухайрах түвшинг хэмжих

    Эрдмийн болон сонгодог текстийн дотор муухайралт байгаа эсэхийг шалгах хамгийн хялбар арга бол тохиолдлуудыг тооцоолж, хайх явдал юм. зөв үгсболон хэллэгийг гараар хийж, бүх үр дүнг тоолно. Гэхдээ энэ нь танд маш их цаг хугацаа, хүчин чармайлтаа алдах болно, энэ нь үргэлж тохиромжтой байдаггүй. Тиймээс сүлжээнд байгаа олон төрлийн үйлчилгээнд анхаарлаа хандуулах нь утга учиртай бөгөөд ихэнх нь бүрэн үнэ төлбөргүй ажилладаг.

    TextusPro програм

    Хүссэн текстээ хуулж, програмын тусгай цонхонд буулгахад хангалттай бөгөөд дараа нь танд шаардлагатай бүх үзүүлэлтүүдийг автоматаар тооцоолох болно. Дотор муухайрахаас гадна энэ үйлчилгээ нь текстийн бусад үзүүлэлтүүдийг шалгах боломжийг олгодог тул түүний тав тухтай байдал нь тодорхой юм.

    Advego биржийн онлайн үйлчилгээ

    Тусдаа програмтай текстийн өвөрмөц байдлаас бусад бүх шалгалтыг таны компьютерийн хөтөч дээр шууд хийх болно. Түүнээс гадна, ийм шинжилгээний үр дүнд хоёр үзүүлэлтийг нэн даруй өгөх болно - академик болон сонгодог дотор муухайрах.

    Энэ үйлчилгээ нь зөвхөн бие даасан үгс төдийгүй өгүүлэлд "онцлох" хэллэгүүдийн давтамж, тохиолдлын тоог харуулдаг тул даалгаврыг ихээхэн хөнгөвчлөхөд тусална. Хамгийн дээд хэмжээ нь 3% гэдгийг анхаарна уу, үүнд онцгой анхаарал хандуулах хэрэгтэй.

    SEO нээлтийн үйлчилгээ

    Энэ нь олон төрлийн баталгаажуулалтын сонголтыг санал болгодог: нэг удаагийн, нэг удаагийн, багц. Энэхүү үйлчилгээ нь хайлтын роботоор дамжуулан спам болон блоклохтой тэмцэхэд үнэхээр тусална.

    Эндээс та аль хуудсууд хайлтаас гарч, аль нь дээшлэхийг тохиромжтой, ойлгомжтой хүснэгт хэлбэрээр харах боломжтой. Та "гүйлт" -ийг ижил төстэй үйлчилгээг хийснээр замын хөдөлгөөнийг тогтмол хянах боломжтой бөгөөд энэ нь тийм ч хэцүү биш, тохиромжтой, хурдан юм.

    Илүүдэл текст дотор муухайрахыг хэрхэн арилгах вэ

    Текстийг шалгаж, "илүүдэл" -ийг тооцоолсны дараа та үүнийг цэвэрлэж эхлэх боломжтой. Жишээлбэл, та хэт их давтамжтай үгсийг ижил утгатай үгээр сольж болно (байна), заримдаа тэдгээрийг материалаас бүрмөсөн устгаж болно. Ийм чекээр бичихэд удаан хугацаа шаардагдах ч үнэ цэнэтэй юм. Таутологийг харгис хэрцгийгээр таслан зогсоох, ихэнх зогсолтын үгсийг орхих нь гэмтээхгүй бөгөөд энэ бүхэн чанарыг сайжруулахад тусална.

    Текст дотор муухайрах нь текстийн баримт бичигт үг ашиглах давтамжийг тодорхойлдог үзүүлэлт юм. Анхаарна уу: зөвхөн үгийн давтамж төдийгүй текстэд ашигласан бусад үгс чухал юм. Жишээлбэл, "наалт суурилуулах" асуулгад зориулж оновчтой болгосон нийтлэлд түлхүүр үг хэллэгээс үгсийг ашиглах давтамж нь "цонх" гэсэн үгийн давтамжаас бага байх болно. Энэ тохиолдолд тухайн асуулгад текстийн хамаарал буурч, үүний дагуу вэб хуудасны өндөр зэрэглэлд орох магадлал буурна.

    Дотор муухайрах хоёр үзүүлэлт байдаг бөгөөд тэдгээрийг өөр өөрөөр тооцдог.

    сонгодог дотор муухайрах

    Сонгодог дотор муухайрах оноо нь текст дэх үгийн давтамжийн квадрат язгуур юм. Жишээлбэл, текстэд үг 16 удаа тохиолдвол түүний сонгодог дотор муухайрах нь 4. Энэ тохиолдолд текстийн эзлэхүүнийг тооцохгүй.

    Сонгодог дотор муухайрах индекс 2.64-ээс бага байж болохгүй. Энэ үгийг текстэд 7-оос бага удаа ашигласан ч гэсэн энэ тохиолдолд квадрат язгуурыг 7-оос гаргаж авдаг.

    Текстийн дотор муухайрах нь юу байх ёстой вэ? Сонгодог текстийн дотор муухайрах хамгийн их зөвшөөрөгдөх утга нь 7. Хэрэв оноо нь энэ үзүүлэлтээс өндөр байвал хайлтын системээр текстийг спам гэж үнэлдэг гэж үздэг.

    Эрдмийн баримт бичиг Дотор муухайрах

    Эрдмийн текст дотор муухайрах гэж юу вэ? Энэ нь баримт бичигт хамгийн их хэрэглэгддэг үгийн давталтын тоог бүх текст дэх үгсийн тоонд харьцуулсан харьцаа юм. Үүнийг хувиар хэмждэг. Өөрөөр хэлбэл, академик дотор муухайрах нь давтамжийн хэмжүүр юм.

    Үгийн давтамжийг хэрхэн хэмждэг вэ?

    Давтамж нь хувь юм. Үүнийг "H" үсгээр тэмдэглэе. "KS" үсэг нь тохиолдол, тоо, хүйс, өөрөөр хэлбэл зөвхөн цэвэр тохиолдлууд төдийгүй морфологийн өөрчлөлтийг харгалзан өөр өөр хэлбэрээр үгийн давталтын тоог илэрхийлдэг ("Түлхүүр үгс" хичээлийг үзнэ үү). Бүх текст дэх үгсийн тоо нь "KST" юм. Дараа нь үгийн давтамжийг тодорхойлох томъёо дараах байдалтай байна.

    COP: CST x 100 = H%

    Түлхүүр үгийн давтамжийг тооцоолох жишээ

    Жишээлбэл, бугуйн цагны тухай богино текстийг авч үзье.

    Швейцарийн бугуйн цаг

    Бид таныг Швейцарь цагны онлайн дэлгүүрт тавтай морилно уу. Манай каталог нь Швейцарийн алдартай брэндүүдийн өргөн сонголттой барааг агуулдаг.

    • Тиссот,
    • кандино,
    • Омега,
    • Сертина.

    Манай худалдаалж буй бүх цагнууд үйлчилгээний төвөөр баталгаажсан.

    Цагны өндөр чанар, механизмын өөгүй, бат бөх ажиллагаа, загварлаг дизайн, онцгой сэтгэл татам, дэгжин байдал - ийм үнэтэй цагийг эзэмших нь үнэхээр нэр хүндтэй юм!

    Яг одоо бидэнтэй холбоо бариарай, та өөрийн дуртай загварын эрэгтэй, эмэгтэй цагны арван хувийн хямдралтай цагны эзэн болоорой.

    "Бугуйн цаг" гэсэн түлхүүр хэллэгийн давтамжийг тодорхойлъё.

    Нийт үгийн тоо 76. Түлхүүр үгийн илрэл - 5 (2 удаа - цэвэр тохиолдлууд, 1 удаа - морфологи, 2 удаа - шингэрүүлсэн). Бид түлхүүр үгээс үг бүрийг тусад нь тоолдог. "Бугуй" гэдэг үгийг өөр өөр хэлбэрээр 5 удаа, "цаг" гэдэг үгийг (мөн янз бүрийн хэлбэрээр) - 6 удаа давтдаг. Тэдний давтамжийг олж мэдье:

    Бугуй 5: 76 x 100 = 0.065 x 100 = 6.5%.

    "цаг" 6: 76 x 100 = 0.078 x 100 = 7.8%

    Бид хоёр үгэнд "спам" илгээдэг. Дашрамд хэлэхэд үүнийг "нүдээр" ч гэсэн тооцоололгүйгээр тодорхойлж болно. Бугуйн цаг нь зүгээр л өвддөг. Текстийн академик дотор муухайрахыг хэрхэн бууруулах вэ? Та нөхцөл байдлыг хоёр аргын аль нэгээр засч болно: та текстийг нэмэгдүүлэх эсвэл түлхүүр үгсийн тоог багасгах хэрэгтэй.

    Олон тооны оновчтой хүмүүсийн үзэж байгаагаар текст дэх түлхүүр үгсийн давтамж 3-5% дотор байх ёстой бөгөөд дараа нь дотор муухайрах нь хэвийн байх болно.

    Давтамж, дотор муухайрахыг тооцоолох дээрх схемүүд нь интернетэд холбогдож, http://istio.com/rus/text/analyz/ текст шинжилгээний тохиромжтой үйлчилгээг ашиглах боломжгүй тохиолдолд танд хэрэгтэй болно. Энэ нь бусад ижил төстэй үйлчилгээний нэгэн адил үгийн давтамж, материалын сонгодог дотор муухайрахыг хурдан бөгөөд үнэн зөв тодорхойлоход тусална.

    Туршлагатай хуулбар зохиогчид давтамж, дотор муухайрахыг бараг хэзээ ч тооцдоггүй. Тэд зөн совингийн түвшинд хүлээн зөвшөөрөгдөх үзүүлэлтүүдийг дагаж мөрддөг. Нэг бус удаа хэлсэнчлэн та хүмүүст зориулж бичих хэрэгтэй. Хэрэв таны бичвэрүүдийг унших нь тэдэнд хялбар бөгөөд сонирхолтой байвал нийтлэлд дотор муухайрах шинж тэмдэг илэрч байвал бүх зүйл эмх цэгцтэй байна.



    Үүнтэй төстэй нийтлэлүүд