Воспитание и фокусы…

Две основные техники, с помощью которых я учу Тиля, — это наведение и шейпинг.

Используя наведение, я беру лакомство, подношу к Тильчиному носу и веду его, пока он не займёт нужное положение: сидеть, лежать, стоять. Правильное положение я отмечаю голосовым маркером “Да!” и отдаю кусок. Это эффективный способ, но только когда речь идёт о простых действиях, в которых Тилю нужно управлять собственным телом: сидеть, лежать, стоять, или взаимодействовать со мной: рядом, домик, вольт.

67957718_367713527228459_702127135992578048_o
Фото: семейный архив, Кирилл Штирбу

Значительно сложнее научить его взаимодействовать с неодушевлённым предметом: принести предмет, держать предмет, встать лапами на маркер. А когда речь заходит о том, чтобы заставить взаимодействовать два неодушевлённых предмета между собой — это вообще высшая собачья математика.

Для таких задач я использую шейпинг, от английского to shape, “формировать, определять”. Я постепенно формирую желаемое поведение, давая Тилю возможность предлагать варианты, пробовать, ошибаться, снова пробовать и получать вознаграждение за удачные попытки.

При этом единственная обратная связь, которую он получает — это щелчок кликера и кусочек лакомства. Я не командую, не подсказываю, не показываю пальцем, не корректирую и не маркирую его ошибки. Ни в коем случае! Только жду, кликаю и выдаю кусок каждый раз, когда поведение соответствует выбранным критериям. Всё остальное время я стою молча, а Тиль самостоятельно решает задачу. В результате Тиль запоминает нужное действие практически после первого поощрения. 

31042945_2070961969806701_8806
Фото: семейный архив, Кирилл Штирбу

Один из самых сложных трюков, которому Тиль научился методом шейпинга, это надевание кольца на столбик. У нас нет специальной команды, Тиль просто видит кольцо и столбик, понимает, что от него чего-то ждут, берёт кольцо и надевает его. Это — взаимодействие двух неодушевлённых предметов, первая предпосылка к эволюции орудий труда.

От простого — к сложному… 

Для тренировки я использую кошачий столбик-когтеточку и кольцо Дог Пуллер размера стандарт. В одну руку — лакомство, в другую — кликер, зову Тиля и просто жду, давая ему возможность подумать и сделать хоть что-нибудь.Тиль чует лакомство, видит кликер и понимает: надо работать.

На первом этапе очень важно запастись терпением и поддерживать высокий уровень подкрепления. Тиль не накинет кольцо случайно с первого раза, поэтому важно разбить обучение на маленькие шаги и  определить критерии поощрения на каждом из них.

В начале даже самые простые варианты, пусть пока неверные, должны поощряться. Высокий уровень поощрения важнее чистоты исполнения. Я поощряю простой взгляд в сторону пуллера, подшаг в сторону столбика, да вообще любую попытку угадать, чего я хочу.

Когда Тиль понимает правила игры и начинает активно предлагать варианты, я ввожу новый критерий отбора поведения. Теперь я кликаю и поощряю только  за взаимодействие с кольцом: шаг в сторону кольца, обнюхивание, касание лапой или носом. Получая вкусняшку за каждый контакт с пуллером, Тиль взаимодействует с ним всё интенсивнее.

Тогда я усложняю критерий: я буду поощрять не любое касание кольца, а только попытку взять его в зубы. Когда Тиль начинает уверенно поднимать кольцо с пола, я добавляю новый критерий: теперь он должен поднять кольцо и отнести его к столбику. Когда и это действие освоено, я снова усложняю: теперь клик и лакомство Тиль получает только за касание столбика кольцом.

а
Фото: семейный архив, Кирилл Штирбу

Никаких наказаний…

Я ни в коем случае не наказываю Тиля за ошибки. Чем свободнее и увереннее он чувствует себя, тем больше вариантов он предлагает и тем больше успешных попыток он предпримет. Количество перерастает в качество.

Дальше — больше, я начинаю поощрять только касание кольцом верхнего края столбика. Уже на этом этапе кольцо будет периодически падать и надеваться на столбик как надо. Такие моменты я отмечаю особенно, хвалю Тиля и выдаю ему сразу три-четыре-пять кусочков сыра вместо одного. Но не тороплюсь усложнять критерии, так как пока надевание кольца — простая случайность, и Тиль ещё не готов делать это целенаправленно.

Закрепляем навык…

Следующий этап: чтобы заслужить поощрение Тиль должен поднимать кольцо над столбиком, задирая голову вверх. Если я продолжаю честно поддерживать высокий уровень поощрения, кольцо всё чаще и чаще оказывается на столбике, так что в конце концов я могу перейти к последнему критерию отбора поведения — поощрять только за кольцо, надетое на столбик. Тут уж Тиль понимает, что от него требуется, и дальше идёт шлифовка и закрепление навыка. Если нужна голосовая команда, она вводится именно на этом этапе.

Текст: Кирилл Штирбу

 

Воспитание и фокусы…: Один комментарий

Добавить комментарий

Заполните поля или щелкните по значку, чтобы оставить свой комментарий:

Логотип WordPress.com

Для комментария используется ваша учётная запись WordPress.com. Выход /  Изменить )

Google photo

Для комментария используется ваша учётная запись Google. Выход /  Изменить )

Фотография Twitter

Для комментария используется ваша учётная запись Twitter. Выход /  Изменить )

Фотография Facebook

Для комментария используется ваша учётная запись Facebook. Выход /  Изменить )

Connecting to %s