چکیده: درآمد شرکتهای حمل و نقل ریلی بیشتر از فروش بلیتهای صندلی به دست میآید؛ بنابراین شرکتها سعی در ایجاد یک سیاست بهینه فروش بلیت برای دستیابی به حداکثر درآمد ممکن برای هر قطار داشته باشد. این تحقیق به بررسی و توسعه روشهای قیمتگذاری پویا در صنعت حملونقل ریلی با استفاده از تکنیکهای پیشرفته یادگیری تقویتی و یادگیری تقویتی عمیق میپردازد. شایان ذکر است که تاکنون تحقیقات اندکی در زمینه قیمتگذاری پویا در سیستمهای حملونقل ریلی با بهرهگیری از روشهای یادگیری تقویتی و یادگیری تقویتی عمیق انجام شده است. هدف اصلی این تحقیق، بهینهسازی درآمد شرکتهای حملونقل ریلی از طریق ایجاد یک سیاست فروش بلیت است که بتواند قیمتهای بلیت را برای هر یک از بخشهای مشتریان بهصورت پویا تنظیم کند و با تطبیق دقیقتر با تقاضای مسافران، درآمد بیشتری کسب کرده و سودآوری خود را بهبود بخشد. برای این منظور، بهطور نوآورانهای اقدام به خوشهبندی مشتریان با ترکیب ویژگیهای RFM و تعداد بلیتهای خریداریشده به تفکیک کلاسهای خدماتی برای بخشبندی مشتریان انجام شده است. این رویکرد بهعنوان یک نوآوری در زمینه بخشبندی مشتریان مطرح میشود و موجب میشود تا الگوریتمهای خوشهبندی بهطور دقیقتری مشتریان را بر اساس الگوهای خرید، الگوهای رفتاری و ارزش مشتریان دستهبندی کنند و خوشههایی با تفکیک بهتر به دست آید. برای حل مسئله قیمتگذاری پویا، از الگوریتمهای Double Q-learning، DQN و DDPG استفاده میشود. این الگوریتمها به شرکتها کمک میکنند تا در هر لحظه قیمت مناسب را برای بلیتها تعیین کنند و با قابلیت یادگیری و تطبیق با شرایط مختلف، قادر به اجرای سیاستهای قیمتگذاری مؤثری با هدف حداکثرسازی درآمد و همچنین تعیین تعداد بهینه بلیتهای فروختهشده برای هر یک از بخشهای مشتریان هستند..