در برخی کاربردها جلسات کاربر را می­توان برای تولید عناصر مفیدتری پردازش کرد. یکی از این نوع عناصر مفهوم تراکنش یا دوره می­باشد. این کلمه از داده­کاوی گرفته شده است و عمدتا در تحلیل سبد خرید مورد استفاده قرار می­گیرد. یک تراکنش، زیرمجموعه ای از صفحات مرتبط است که در یک جلسه­ی کاربر رخ داده­اند. به منظور شناسایی تراکنش ها [Cooley 1997] فرض کرده است که تراکنش ها به رفتار گردشی یک کاربر خاص در وب سایت به شدت وابسته هستند و می­توان آن­ها را با استفاده از اطلاعات مفهومی شناسایی کرد. بر مبنای این فرض، صفحات یک سایت به سه دسته تقسیم می­شوند. دسته­ی اول صفحات گردشی یا دلخواه هستند که عمدتا شامل لینک به صفحات دیگر هستند و فقط برای مرور کردن سایت استفاده می­شوند. دسته­ی دوم صفحات محتوایی هستند که شامل داده­های مورد علاقه­ی کاربر می­باشند و دسته­ی سوم صفحات ترکیبی هستند که خصوصیات هر دو دسته­ی قبلی را دارند. اگرچه صفحاتی در وب وجود دارند که بطور واضحی در یکی از این سه گروه قرار می­گیرند، مانند صفحات اندیس و صفحات اصلی سایت، اما این دسته بندی صراحت کافی ندارد و به نحوه­ی دید کاربر بستگی دارد. یک صفحه که برای یک کاربر خاص صفحه­ی گردشی محسوب می­شود ممکن است برای کاربر دیگر صفحه­ی محتوایی به شمار آید.

در [Cooley 1999] تراکنش ها به دو دسته تقسیم شده اند. دسته­ی اول تراکنش­های فقط محتوایی هستند که متناظر با صفحات محتوایی­ای می­باشند که کاربر مشاهده کرده است. دسته­ی دوم تراکنش های محتوایی-گردشی می­باشند که متناظر با مسیرهایی هستند که به صفحات محتوایی ختم می­شوند. دو روش برای شناسایی تراکنش ها وجود دارد که عبارتند از طول ارجاع و حداکثر ارجاع به جلو. روش طول ارجاع، مدت زمانی را که کاربر بر روی یک صفحه صرف می­کند در نظر می­گیرد. اگر این مدت زمان از یک مقدار آستانه بیشتر باشد، آن­گاه فرض می­شود که آن صفحه حاوی اطلاعات مفیدی می­باشد و از این رو یک صفحه­ی محتوایی است و به تراکنش­های فقط محتوایی اضافه می­شود. در غیر این صورت آن صفحه، گردشی در نظر گرفته می­شود و به تراکنش­های محتوایی-گردشی اضافه می­شود. در تراکنش­های محتوایی-گردشی فرض می­شود که آخرین صفحه­ی ملاقات شده توسط کاربر همیشه یک صفحه­ی محتوایی است. هرگونه وقفه­ای که توسط عوامل خارجی در دنباله­ی مرور کاربر ایجاد شود ممکن است به تشخیص اشتباه یک صفحه­ی محتوایی منجر شود. مشکل دیگر در رابطه با این روش، تعریف مقدار مناسب برای آستانه است که بسیار وابسته به محتوای سایت می­باشد. در روش حداکثر ارجاع به جلو، یک تراکنش بصورت مجموعه­ای از صفحات تعریف می­شود که از اولین صفحه شروع شده و به صفحه­ای ختم می­شود که در آن یک ارجاع به عقب رخ داده است. یک ارجاع به عقب، صفحه­ای است که اخیرا در تراکنش جاری وجود دارد. تراکنش بعدی با ارجاع به جلوی بعدی شروع می­شود، یعنی صفحه­ی جدیدی که در تراکنش ذخیره شده موجود نمی­باشد. با استفاده از دسته­بندی صفحات به محتوایی و گردشی، می­توان گفت که صفحات حداکثر ارجاع به جلو صفحات محتوایی هستند، در حالی که صفحاتی که به این صفحات منتهی می­شوند صفحات گردشی می­باشند. این روش یک مزیت نسبت به روش طول ارجاع دارد، چون مستقل از محتوای سایت است. با این وجود، از یک مشکل مهم رنج می­برد و آن این است که کش کردن صفحات وب مانع از ذخیره شدن ارجاعات به عقب در فایل­های ثبت می­شود.

روش دیگری نیز برای تشخیص تراکنش وجود دارد که از اطلاعات مفهومی برای شناسایی یک دنباله از اعمال که مرتبط با یک قلم خاص می­باشند، در دنباله­ی مرور کاربر استفاده می­کند. این دنباله از اعمال تمرکز توجه جاری نامیده می­شوند. اعمالی که بدون تغییر تمرکز مرور انجام می­شوند تاریخچه­ی محلی را تشکیل می­دهند و برای تحلیل رفتار کاربر مورد استفاده قرار می­گیرند.

در [Li 2004] مفهوم ماموریت بجای مفهوم تراکنش معرفی شده است. ماموریت زیرمجموعه­ای از جلسه است که حاوی نیازهای اطلاعاتی مرتبط می­باشد. در مدل مبتنی بر ماموریت، کاربران از وب­سایت با اهداف همزمان یعنی نیازهای اطلاعاتی گوناگونی در یک لحظه، دیدن می­کنند. توجیه ماموریت آن است که یک بازدید کننده ممکن است در طول یک ملاقات از وب­سایت نیازهای گوناگونی داشته باشد. ماموریت ها هیچ فرضی درباره­ی ترتیبی که این نیازها باید ارضا شوند، نمی­کنند، در حالی که در تراکنش ها این فرض وجود دارد که نیازهای اطلاعاتی یکی پس از دیگری برآورده می­شوند. در تعریف ماموریت امکان همپوشانی بین ماموریت ها وجود دارد. این مقاله ادعا می­کند که ماموریت ها بهتر از تراکنش ها رفتار گردش کاربر در وب سایت را مدل می­کنند.

با این وجود یافتن تراکنش­ها نیاز به واژگان شناختی وب­سایت دارد که در آن موضوعات موجود در وب­سایت توصیف شده اند. یافتن موضوعات معنایی برای یک وب­سایت بصورت خودکار هنوز یک مساله­ی حل نشده می­باشد[Tanasa 2005] . در بخش 2-2-3 در مورد واژگان شناختی و منابع آن توضیح خواهیم داد.