Информацията може да бъде извличана от корпуса посредством три отделни механизъма за търсене, базирани съответно върху:
Читателят има възможност да избере в какъв обхват от корпуса да търси: във всички диалектни текстове, в текстовете, записани в едно или повече селища, или в текстовете, представящи един или повече отвъддунавски говори. При това в намерените резултати не влизат репликите на диалектолозите, които водят анкетата, а само репликите на техните информатори. Единственото изключение са глосите на румънски елементи, тъй като, за да станат текстовете по-разбираеми, с глоси са снабдени всички реплики, независимо чии са те.
Диалектните текстове, включени в корпуса, са структурирани като отделни отрязъци според темата, засегната в тях. Тези отрязъци, наречени теми, са номерирани и имат заглавия, които дават най-обща представа за какво става дума в съответния текст. Освен това темите са индексирани с ключови думи от различен ранг – типове теми и етикети. Резултатът от търсене по ключови думи е списък от заглавия на теми, които съответстват на зададените критерии за търсене, придружени от номерата на темите, имената на селищата, където са били записани, както и линкове към тези теми.
При търсене на лексеми не е необходимо те да бъдат изписани изцяло. Читателят може да търси по последователности от букви, които са произволни отрязъци от думи или, да речем, съответстват на корени, афикси и окончания. Тъй като търсенето не отчита ударението, резултатите включват всички зададени форми независимо от техните ударения. Резултатите се представят във вид на списък от намерени думи, съответстващи на зададените критерии за търсене. Всяка от думите е съпроводена от число, което показва броя на намерените съвпадения за същата форма. По желание на читателя намерените форми могат да бъдат показани в контекст, тоест те могат да се явят като конкорданс, като читателят предварително избира дали от двете страни на намерените форми да има по 6, по 12, или по 24 думи от контекста. Когато задържи курсора върху даден ред на конкорданса, читателят вижда плаващо прозорче, съдържащо името на селището, номера на темата и номера на реда, където се намира нужната им лексема. Същата информация е достъпна и в началото на реда и като линк към съответната тема. Ако е необходимо, читателят може да маркира намерения конкорданс и да го запази чрез copy и paste в свой файл.
Една от най-големите трудности, пред които са изправени читателите при търсене в текстове, които не са на стандартизирани, е вариативността на присъстващите в тях словоформи. Съществуващите в момента диалектни лексикални картотеки и публикувани диалектни речници разчитат техните читатели да издирят самостоятелно вариантите на необходимите им словоформи, всеки в зависимост от своята опитност и информираност. Препратките към възможни алтернативни варианти вътре в речниците и картотеките са непоследователни, доколкото въобще ги има. При търсене трябва да се отчитат и общите отличия на приетата в българската диалектология транскрипция от българския книжовен правопис: замяната на букви я, ю, щ и ь с йа (йъ, ’а, ’ъ), йу (’у), шт и апостроф, а също така замяна на диграфите дж и дз с џ и s.
Някои от най-важните диалектни явления, които допринасят за вариативността на словоформите са следните:
В момента механизмът на търсене в корпуса не позволява автоматично да се намерят всички варианти на наличните словоформи. Когато корпусът бъде завършен и целият запас от словоформи е налице, ще може да бъде съставен пълен списък на възможните вариации и тогава ще се пристъпи към създаването на нов механизъм за търсене, който при изписване на една словоформа в прозорчето за издирване в идеалния случай ще извлича от корпуса всички нейни варианти.
Носителите на отвъддунавските диалекти са двуезични и постоянно включват румънски елементи в своята българска реч. Всички такива елементи ще бъдат постепенно глосирани на книжовен български език според значението на съответната румънска дума, израз или изречение в контекста, в който са употребени. В корпуса от глоси към диалектните текстове ще може да се търси по румънския елемент, изписан според правилата на съвременния румънски правопис, или по неговия български превод. Резултатът от търсене по румънски глоси ще представлява списък на глосите, които съответстват на зададените критерии за търсене, придружени от имената на селищата, заглавията и номерата на темите и на редовете в тях, както и линкове към тези теми.
Към всяка от трите търсачки има приложени кратки инструкции за улеснение на читателя.