هنگام تعیین اقدامات برای اجرا، یادگیرندگان تقویتی دائماً با تصمیم بهرهبرداری از دانش موجود یا بررسی گزینههای جدید مواجه هستند که هزینههای کوتاه مدت را به خطر میاندازد اما به طور بالقوه عملکرد را در بلندمدت بهبود میبخشد. این مقاله چهار استراتژی کاوش/ بهرهبرداری موجود برای سیستم دستهبند یادگیری XCS را توصیف و به صورت تجربی ارزیابی میکند. ارزیابی روی سه مسئله معروف یادگیری - دو مالتی پلکسر و یک محیط ماز انجام می شود. یک بهینهسازی پارامتر خودکار انجام میشود، که نشان میدهد محیطهای مختلف به پارامترسازی متفاوتی از استراتژیها نیاز دارند. علاوه بر این، نتایج ما نشان میدهد که هیچ یک از استراتژیها برتر از استراتژیهای دیگر نیست. به نظر میرسد که مسائل چند مرحلهای با پاداشهای کمیاب برای استراتژیهای انتخاب شده چالش برانگیز است و نیاز به توسعه استراتژیهای کاوش/ بهرهبرداری قابل اعتمادتر برای مقابله با چنین محیطهایی را برجسته میکند.
گرامر و برنامههای کامپیوتری ارتباط نزدیکی با هم دارند. هم گرامرها و هم برنامهها راهحل مسائل پیچیده با اجرای دنبالهای از عملیات ابتدایی را تولید میکنند. در دهه 1830، چارلز بابیج یک کامپیوتر قابل برنامهریزی به نام Difference Engine با ترکیب دستگاههای مکانیکی برای جمع و ضرب طراحی نمود. کامپیوترهای امروزی که در همه جا حاضر هستند مستقیم تجسم ایدههای بابیج هستند. به طور مشابه، گرامرها از مراحل ساده برای تعریف اشیاء پیچیده استفاده میکنند، اجازه میدهد هر دو الگوریتمی و مطالعه نظری اشیاء تعریف شوند. به عنوان پیش درآمدی برای ارتباط گرامرها و پویاییهای محدود تولید شده، و به عنوان راهی برای ایجاد شهود در مورد امکانات گرامر، این فصل گرامرها را در "منطقه اصلی" مطالعه زبان بررسی میکند.
گرامرها در ابتدا استان زبان شناسی توصیفی بود که برای اکثر ما از تمرینات دبیرستان در نمودار نویسی جملات آشنا بود. در سال 1951، استفان کلین، منطقدان با ابداع فرمال، دستور زبان گرامر برای توضیح رویکرد پیشگامانه اما دشوار وارن مک کالوخ و والتر پیتس برای طراحی «مدارهای منطقی» وارد علوم کامپیوتر نمود (کلین 1956). گرامرها از آن زمان تاکنون نقش محوری در علوم کامپیوتر نظری و عملی داشتهاند. در اواخر در دهه 1950، نوام چامسکی گرامرها را با حدس زدن اینکه همه زبانهای طبیعی تغییراتی در یک گرامر جهانی واحد (UG) هستند، دایره کامل گرامرها را ایجاد کرد و یک علم رسمی از زبان شناسی در این فرآیند را ارائه کرد (چامسکی 1965). بر اساس حدس چامسکی، هر زبان انسانی مشاهده شده از یک زبان دستور زبان جهانی با تنظیم (یا یادگیری) مقادیر برای مجموعهای از متغیرهایی که پارامتر نامیده میشوند به دست میآید. یک بار مقادیر برای پارامترها تنظیم میشوند، تمام قوانین دستور زبان جهانی خاص، تعیین یک زبان خاص میشوند.
ایده طاقچه
در مطالعه اکوسیستمها معمولاً مفهوم طاقچه محدود به نوع خاصی از عامل، معمولاً یک بخش خاص است. طاقچه با جریان مداوم منابع "قدرت[1]"، بسیار شبیه گردابی در جریانی سریع میشود. اصطلاح به همین شکل است در عباراتی مانند "طاقچه بازار[2]" استفاده میشود. با این حال، سودمند است که در یک رویکرد کلی برای گسترش سیستمهای سیگنال/مرزی تفسیر به طوری که شامل کنگلومراها میشود (به عنوان مثال، مجموعهای از عوامل متنوع و وابسته به هم). سپس اصطلاح طاقچه میتواند برای تعیین تعاملات پیچیده آن مرکز در یک بروملیاد[3] در یک جنگل بارانی (همانطور که در فصل 1 توضیح داده شد) یا یک اداره دولتی (مانند بورس و کمیسیون اوراق بهادار) استفاده شود.
تحت این تفسیر، طاقچه مجموعهای از تعاملات محلی با گردش مجدد را مشخص میکند که امکان استفاده از منابع را دوباره و دوباره فراهم میکند. برای طاقچه بروملیا، کربن میتواند به عنوان منبعی که از موجودی به موجود دیگر منتقل میشود باشد با تهی شدن اندک، به افراد مختلف اجازه میدهد تا به طور مستقل در یک منطقه زندگی کنند. پول نقد نقش مشابهی را در یک طاقچه اقتصادی و عبور آن از زنجیرهای از خریداران و فروشندگان باعث ایجاد اثر چند برابری[4] میشوند (ساموئلسون و نوردهاوس 2009). به طور کلی، در یک شبکه، یک طاقچه یک انجمن[5] با تعداد زیادی اتصال داخلی اما اتصالات خارجی نسبتاً کمتر است (نیومن، باراباسی و واتس 2006)، امکان نمایش جزئی را برای رفتار خودمختار انجمن فراهم میکند. در هر مورد، گردش مجدد منابع به این معنی است که فعالیت در طاقچه نمیتواند صرفاً با جمع کردن فعالیتهای عوامل مختلف طاقچه اشغال گردد.