<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2//EN">
<HTML>
<HEAD>
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=us-ascii">
<META NAME="Generator" CONTENT="MS Exchange Server version 5.5.2653.12">
<TITLE>compseq: is U an amino acid</TITLE>
</HEAD>
<BODY>

<P><FONT SIZE=2 FACE="Arial">I have been using compseq for protein sequences and wondered why 'U' is reported as an amino acid?</FONT>
<BR><FONT SIZE=2 FACE="Arial">I looked in the code (nucleus/embnmer.c) and found it was specifically accounted for, whereas 'X' which in many databases&nbsp; as unknown is not specifically accounted for.</FONT></P>

<P><FONT SIZE=2 FACE="Arial">Would it not make sense to have options which made specific symbols part of the alphabet or left them out: </FONT>
<BR><FONT SIZE=2 FACE="Arial">-leaveout XU or -include BZXU</FONT>
</P>

<P><FONT SIZE=2 FACE="Arial">Jacob Engelbrecht, Phd</FONT>
<BR><FONT SIZE=2 FACE="Arial">Insulin Research</FONT>
<BR><FONT SIZE=2 FACE="Arial">Novo Nordisk</FONT>
<BR><FONT SIZE=2 FACE="Arial">6A1.038 Novo Alle</FONT>
<BR><FONT SIZE=2 FACE="Arial">DK-2880 Bagsvaerd</FONT>
<BR><FONT SIZE=2 FACE="Arial">Denmark</FONT>
<BR><FONT SIZE=2 FACE="Arial">tel: +45 4442 4403</FONT>
<BR><FONT SIZE=2 FACE="Arial">mail: jaen@novonordisk.com</FONT>
</P>

</BODY>
</HTML>