علاوه بر مراحل پیش، چندین عمل تبدیل نیز می­تواند بر روی داده های تراکنشی انجام شود. در این قسمت به برخی از این اعمال اشاره می­کنیم. چنین اعمالی باعث بهبود در دقت توصیه های سیستم شخصی­سازی بر مبنای وب­کاوی کاربرد وب می­شوند [Mobasher 2004].

  • فیلترکردن ارزشی

تعیین درجه­ی ارزش هر مشاهده صفحه یا قلم اهمیت زیادی دارد. به عنوان مثال یک کاربر ممکن است به یک قلم مانند i رجوع کند تا بفهمد که آیا به آن علاقه دارد یا خیر، سپس بلافاصله به بخش دیگری از سایت مراجعه کند. از این رو می­توان این نوع دسترسی کاربر به قلم i را یک دسترسی غیرارزشمند به حساب آورد. به حذف صفحات یا اقلامی که توسط کاربر درخواست شده اند و غیرارزشمند بوده اند، فیلترکردن ارزشی گفته می­شود. میزان ارزش یک صفحه در تراکنش کاربر می­تواند بصورت دستی یا خودکار تعیین شود. در رویکرد دستی، صاحب سایت یا تحلیل­گر، مسئول نسبت دادن وزن های ارزشی به صفحات یا اقلام مختلف هستند. این عمل معمولا با یک نگاشت سراسری از اقلام به وزن ها انجام می­شود و از این رو ارزشمندی یک مشاهده صفحه در این روش به کاربر یا تراکنش خاصی وابسته نیست. بطور معمول­تر، تابعی از مدت زمان مشاهده­ی صفحه برای نسبت دادن وزن های ارزشمندی بصورت خودکار بکار می­رود. بطور کلی این که مشاهده­صفحه های دارای مدت زمان کوچک را حذف کنیم کافی نیست، چون مقدار زمانی که کاربر بر روی یک صفحه صرف می­کند فقط وابسته به علاقه­ی او به آن صفحه نمی­باشد. مدت زمان مشاهده­ی صفحه می­تواند به مشخصه ها و محتوای آن صفحه هم وابسته باشد. به عنوان مثال انتظار می­رود که کاربران زمان کمتری بر روی صفحات گردشی نسبت به صفحات محتوایی صرف کنند.

آزمایش­های آماری ارزشی می­تواند برخی از این ویژگی ها را معلوم کند. هدف فیلترکردن ارزشی حذف اقلام نامربوطی است که بطور چشمگیری دارای مدت زمان مشاهده­ی کمتری از یک مقدار آستانه در تراکنش می­باشند. بطور معمول سنجه های آماری مانند میانگین و واریانس را می­توان برای تعریف این مقادیر آستانه جهت فیلترکردن استفاده کرد.

  • نرمالسازی

مقادیر خام داده ها مانند مدت زمان صرف شده بر روی صفحات ممکن است برای ارزشمندی یک مشاهده صفحه مناسب نباشد. این به آن علت است که فاکتورهای زیادی مانند ساختار، طول و نوع مشاهده صفحه و همچنین علاقه­ی کاربر به یک قلم خاص در صفحه می­توانند مدت زمان صرف شده بر روی آن را تحت تاثیر قرار دهند. نرمالسازی وزن ها بطور مناسب می­تواند نقش اساسی در تصحیح این فاکتورها ایفا کند. در کل دو نوع نرمالسازی را می­توان بکار برد که عبارتند از نرمالسازی در طول مشاهده صفحات هر تراکنش بطور منفرد و نرمالسازی وزن مشاهده صفحه ها در تمامی تراکنش ها. این دو نوع به ترتیب نرمالسازی تراکنش و نرمالسازی مشاهده صفحه نامیده می­شوند. نرمالسازی مشاهده صفحه برای تعیین وزن یک مشاهده صفحه برای یک کاربر نسبت به وزن همان مشاهده صفحه برای کاربران دیگر بکار می­رود. نرمالسازی تراکنش، درجه­ی اهمیت یک مشاهده صفحه­ی یک کاربر خاص را نسبت به سایر اقلام مشاهده شده توسط آن کاربر در همان تراکنش تعیین می­کند. نوع دوم خصوصا برای تمرکز بر صفحات هدف در تاریخچه های کوتاه از کاربر مفید است